안녕하세요! 기형쌤입니다!

 

갑자기 날이 추워졌네요. 다들 감기 걸리지 않게 조심하시구요ㅠㅠ

이 시국에 감기 한 번 잘못 걸리면 너무 불안하잖아요

코로나가 아닌지? 그냥 감기인건지? 우리 그런 일을 겪지 않게끔

최대한 조심하면서 살자구요!

 

오늘 제가 가져온 이야기는 바로 R 언어에 관한겁니다.

R언어? 그게 뭐지? 하고 생소해 하실 분들도 계실텐데요

R 언어는 빅데이터 관련업계 종사자분들이

거의 필수적으로 알고계셔야 하는 프로그래밍 언어 중 하나입니다.

왜 그런걸까요? 같이 알아보도록 해요!

R언어는 1993년 뉴질랜드에 위치한 오클랜드 대학교에서 개발된

통계 및 그래프 작업을 위한 인터프리터 프로그래밍 언어입니다.

 

영국식 언어를 사용하는 뉴질렌드에서 개발한 언어여서 그런지

color를 colour 라고 쓰는것도 인정되는 특징이 있습니다.

 

다른 프로그래밍 언어들 및 통계 솔루션과 비교하자면

SPSS, STATA, SAS 등 유사 소프트웨어들이 있고 요즘엔 Python도 많이 사용하고 있습니다.

SPSS는 통계학용이라는 목적만 같을 뿐 실제로 사용해보면 나머지 언어들과는 좀 다릅니다.

STATA는 R에 비해 프로그래밍 자유도가 낮다는 등의 단점이 있지만,

대신 계량경제학(특히 실증미시경제학)에 특화되고 상대적으로 배우기 쉽다는 장점이 있습니다.

SAS는 유료 통계분석 언어중에 가장 유명한 언어입니다.

위의 언어들 중 그나마 R에 가장 가깝다고 할 수 있는 언어이기도 합니다.

Python은 앞의 언어들보다는 좀 더 일반적이고 범용성이 큰 언어입니다.

통계나 수치해석을 위한 라이브러리를 동원해 통계분석용으로 쓸 수 있습니다.

 

Python에 관한 자료는 제가 이전에 게시해놓았던 Python 자료에서 보실 수 있습니다.

kiihakjumcircle.tistory.com/entry/Python%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9D%80-%EB%AC%B4%EC%97%87%EC%9D%B4%EA%B3%A0-%EC%96%B4%EB%94%94%EC%84%9C-%EB%B0%B0%EC%9A%B8-%EC%88%98-%EC%9E%88%EB%82%98%EC%9A%94?category=909606

 

Python(파이썬)은 무엇이고 어디서 배울 수 있나요?

안녕하세요? 기형쌤입니다!! 오늘 제가 들고 온 것은 바로 Python입니다. Python은 수많은 프로그래머들의 기본소양이라고 할 정도의 언어입니다. Python은 그 기원이 굉장히 특이한 언어인데요. 바로

kiihakjumcircle.tistory.com

 

R언어의 장점

이렇게 비슷한 성향의 언어들이 있는데 왜 R 언어를 사용하는 걸까요?

그 이유는 일단 첫 번째로 오픈 소스로 배포되고 있어 무료로 사용이 가능하다는 점이 있습니다.

SPSS나 MATLAB과 같은 상용 프로그램을 구입하지 않아도 된다는 장점이 있습니다.

또 R언어는 오픈소스 언어이기 때문에 그러한 언어들의 특징인

사용할 수 있는 수많은 통계 관련 패키지가 개발되어 있어서 인터넷을 통해 이 패키지들을 설치하는 식으로

무수한 기능 확장이 가능합니다.

애초에 통계학자들이 만들어 낸 언어이기도 하고 통계 전문 언어 중 가장 보편적이기 때문에

내가 사용하고 싶은 모든 통계 기법이 이미 어딘가에 패키지 형태로 구현되어 있다고 봐도 무방합니다.

 

또한 그래픽 관련 패키지를 설치하면 간단하게 다양한 그래프를 활용할 수 있으며

구글이나 네이버 지도를 불러오거나 이를 활용해 GIS 용도로 쓰는 것도 가능하게 해줍니다.

 

웹 어플리케이션 개발 프레임워크인 Shiny의 고도화로 통계 또는 머신러닝 모델을 웹과 연동할 수 있고,

가장 중요한 데이터 마이닝, 빅 데이터 프로세싱, 기계학습 등에 유용하게 사용할 수 있습니다.

 

통계와 관련된 언어이기에 리스크, 재무, 마케팅 담당자 채용 시 R 능통자를 우대하기도 합니다.

 

R언어의 단점?

이렇게 좋은 수많은 장점을 가진 R언어는 왜 사람들이 많이 알지 못 하는걸까요?

그 이유 중 커다란 파이를 차지하는 이유 중 하나는 바로

어려워서 입니다.

물론 이것은 컴퓨터 공학자가 아니라 일반인 입장에서 어렵다는 것입니다.

그 이유는 R자체가 원래 통계 프로그램인 S를 그대로 배껴서 만든 프로그램이었기에

R은 원래 통계분석 프로그램이였습니다.

문제는 통계학자들도 R언어를 배워야하는데, 프로그래밍이 가능하게 만들면서

다양하게 만들고 분석할 수 있는 가능성을 갖음과 동시에, 프로그래밍을 알아야 한다는 단점이 생겨버렸습니다.

통계분석 프로그램으로 유명한 SAS, STATA, Minitab에 비하면 월등히 어려워서

한 동안은 대학에서도 취급하지 않았고, 일부 저널에서는 받아주지도 않았었습니다.

 

다만 2000년대 중후반에 코딩이 중요해지면서, R의 인기가 올라갔습니다.

그 이유 중의 커다란 파이를 차지한 것은 다름이 아닌 공짜 라는것 때문이었습니다.

 

통계 분석하는 함수들이 기본적으로 들어가있으면서,

무료로 프로그래밍이 가능하기에 현재 많은 통계분석 프로그램 유일하게

SAS의 명성을 따라잡을 수 있는 언어가 되었습니다.

 

안타까운 것은 프로그램 자체의 한국어 기능을 제공하지 않는다는 점입니다.

다른 프로그램들마냥 한국어 주석을 생각없이 넣었다가는

코드를 잘 짜놓고도 오류가 가득한 모습을 볼 수 있을것입니다.

특히 함수나 for문 등 연속적인 작업이 이루어지는 코드 내부에

한글로 이루어진 주석을 꽉꽉 채워 넣거나 한다면...그러지 않기만을 바랍니다ㅎㅎ

 

개발환경

RStudio라는 환경에서 개발을 하는 것이 가장 무난합니다.

R 본체가 설치되어 있어야 작동하며, 훨씬 편리한 인터페이스를 제공하는 것이 강점입니다.

단, 폴더 경로나 파일 이름에 한글이 들어가면 제대로 작동하지 않을 수 있으니 주의해주셔야 합니다.

 

그 외의 에디터들에는 ConTEXT, jEdit, LyX 등이있지만 보통

R에 대한 문법 검사와 코드 색상을 지원하는 플러그인 형태로 제공됩니다.

 

R언어를 배우려면?

이제 R언어는 빅데이터 개발자 쪽으로 진로를 정하신 분들이라면

하둡 프로그래밍과 함께 무조건 배워야하는 언어로서 자리잡았습니다.

그렇다면 어디서 R언어를 배울 수 있을까요?

 

저희 빅데이터 전문가 과정에 R언어를 배우실 수 있는 과정이 포함되어 있습니다.

R언어 이전의 C, Python 등 필요한 언어들을 배워가시면서

진행하실 수 있으니 부담스러워 하지 마시고 문의주세요.

하단의 네임카드를 클릭해주시면 바로 상담 가능합니다.

네임카드를 클릭해주세요!

안녕하세요 기형쌤입니다.

 

기분 좋은 주말이에요!

한 해를 마무리해가는 12월! 여러분은 잘 보내고 계신가요?

연말은 연말이라 바쁘고 연초는 연초라 바쁘고

바쁠일이 너무 많아 몸이 남아나질 않네요ㅠㅠ

 

오늘 제가 가져온 이야기는 빅데이터 프로세싱에 관한 이야기입니다.

 

빅데이터 프로세싱이란?

말 그대로 디지털 시대에서 폭증하는 너무나도 방대한 양의 정보(Big Data)를

관리하고 분석해서 유용한 정보로서 사용할 수 있게 만든는 기술을 지칭합니다.

 

과거에는 정보로서 기록되지 않았던 매우 사소한 정보까지도

디지털 정보로 기록되는 정보화 시대에서는 너무나도 정보의 양이 많아졌습니다.

 

내가 어디에 있는지에 대한 위치정보, 뭘 먹고 싶어서 검색했는지에 대한 정보,

어떤 음악을 플레이 했는지에 대한 정보, 운동을 위해 얼마나 달렸는지에 대한 정보까지

전부 데이터로서 기록이 되니 정보는 넘쳐날 수 밖에 없죠.

 

또한 거기에 더해 단순한 문자 데이터에서 벗어나

녹음, 사진, 동영상 등 데이터의 종류가 다양해지고 데이터의 용량 자체도 큰 폭으로 늘어났습니다.

이런 빅 데이터는 기존의 기술이나 도구로는 원활한 수집과 처리가 불가능할 정도로

성질이 달라졌으므로 빅 데이터에서 유용한 정보를 추합하거나 가치를 뽑아내기 위해서

고안된 기술이 바로 빅 데이터 프로세싱입니다.

 

빅데이터는 사람들의 마음 속을 어느 정도 계량화해서 데이터로 만들어 응용하는 것을

목적으로 만들어진 기술이기에 주요 대기업들 사이에서 독자적인 빅 데이터 응용 모델 만들기가 대유행 중입니다.

빅데이터를 활용할 수 있는 분야는?

그렇다면 이러한 빅데이터를 활용할 수 있는 분야는 어디일까요?

수많은 곳에서 빅데이터를 이용할 수 있지만 대표적으로 추천 엔진이 있습니다.

 

예를 들어 페이스북의 당신이 알 수도 있는 사람 이라던지

유튜브의 추천 영상 등에 활용되어 사용될 수 있습니다.

 

심리/동향 분석에도 사용되는데,

SNS 포스팅이나 인터넷 광고 클릭 성향 등을 통해 맞춤형으로 정보를 전달하는 등의 활용이 되고 있습니다.

 

인공지능의 구현에도 빅데이터가 기반이 되는 기술입니다.

대표적으로 알파고를 떠올리실 수 있습니다.

알파고 또한 과거 대국의 정보를 바탕으로 한 수 한 수에 대한 승률을 계산해 다음수를 착수하는 것 과 같이

아직은 스스로 생각할 수 없기에 과거의 빅데이터를 기반으로

가장 높은 확률로 정답인 것을 찾아가는 형태로 발전해나가고 있습니다.

 

기타 도시학 연구, 네트워크 모니터링, 인터넷 사기의 탐지 등 수많은 분야에 빅데이터는 사용될 수 있습니다.

 

국내의 빅데이터 분석기사 자격증?

2019년 국내에 빅데이터 분석기사 자격증이라는 것이 신설되었습니다.

기사급의 자격증으로 2020년 하반기 최초 시행되었습니다.

 

한국데이터산업진흥원에서 시행하는 빅데이터분석기사 시험에 합격하여 그 자격을 취득한 사람을 말합니다.

빅데이터분석기사 시험은 필기시험과 실기시험으로 이루어지며

필기시험은 객관식으로 100점을 만점으로하여 과목당 40점 이상, 전 과목 평균 60점 이상이면 합격이 인정됩니다.

실기시험은 실무 통합형 시험으로 100점을 만점으로 하여 평균 60점 이상이면 합격하게 됩니다.

 

아직 국내에서 시행된지 얼마 되지 않은 자격증이지만 수많은 사람들이 몰려

11월 사이트가 먹통이 되어 아무도 접수하지 못하고 일정이 늦춰졌습니다.

 

오는 12월 19일 첫 필기시험이 진행되어 아직 국내에 자격증 취득자는 없지만

워낙 유망한 직종인 빅데이터 관련 자격증이고

국가 자격증인지라 취득시 취업에 굉장히 유리해질 것으로 예측됩니다.

빅데이터 기술을 배우려면?

빅데이터 전문가가 되려면 기본적으로 Python언어를 알고있어야 합니다.

현재 프로그래밍 업계에서 가장 중요한 언어라고 한다면 단연 Python입니다.

쉬우면서도 범용성 넓은 Python은 제가 Python에 대해 설명해놓은 게시글이 있으니

그 글을 읽어보시면 이해하기 편하실겁니다.

kiihakjumcircle.tistory.com/entry/Python%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9D%80-%EB%AC%B4%EC%97%87%EC%9D%B4%EA%B3%A0-%EC%96%B4%EB%94%94%EC%84%9C-%EB%B0%B0%EC%9A%B8-%EC%88%98-%EC%9E%88%EB%82%98%EC%9A%94?category=909606

 

Python(파이썬)은 무엇이고 어디서 배울 수 있나요?

안녕하세요? 기형쌤입니다!! 오늘 제가 들고 온 것은 바로 Python입니다. Python은 수많은 프로그래머들의 기본소양이라고 할 정도의 언어입니다. Python은 그 기원이 굉장히 특이한 언어인데요. 바로

kiihakjumcircle.tistory.com

 

그리고 네트워크 기반의 기술이니 CCNA(네트워크 기초)정도도 알고 계시는게 좋겠죠?

또한 대용량 데이터를 분석, 처리할 수 있는 기술인 하둡 프로그래밍 또한 배우셔야 합니다.

 

배울게 너무 많죠?

 

그래서 빅데이터 전문가를 생각하시는 분들은 어느정도 프로그래밍에 대해

전반적인 기초 지식이 있어야 합니다.

하지만 걱정 마세요!

기초부터 차근차근 가르쳐드리는 전문가 과정을 소개해드리겠습니다.

 

아래의 네임카드를 클릭하시면 바로 상담해드릴 수 있으니 문의 주세요!

상담은 무료로 진행되니 부담없이 연락 남겨놔주시면

빠르게 전문가 과정으로 이끌어드리겠습니다▼

네임카드를 클릭해주시면 바로 상담 도와드리겠습니다!

+ Recent posts