문과생, 데이터 사이언티스트 되다
차현나 지음 / 더퀘스트 / 2020년 6월
평점 :
장바구니담기


데이터 사이언티스트가 어떤 일을 하고 이 분야에서 일하기 위해 필요한 역량은 무엇인지 배울 수 있다. 또한 데이터 관련 프로젝트가 어떤 식으로 진행되는지 간단한 사례와 함께 살펴봄으로써 전반적인 업무의 진행 방식을 간접적으로나마 느껴볼 수 있다. 마지막에는 진로선택과 관련된 저자만의 노하우인 ‘캐릭터 마이닝‘ 이라는 것이 나오는데, 이것은 취업이나 이직 혹은 전직을 고려하는 사람들에게 도움이 될 듯하다.

댓글(0) 먼댓글(0) 좋아요(12)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

오늘 시작하는 내용에서는 기억이라는 것이 실제와 실제가 아닌 것이 혼합되어 재구성된 것이라는 점을 우리에게 말해준다. 본문에는 기억에 관해 연구하는 도네가와 스스무라는 박사님의 인터뷰가 실려있는데, 이 분의 연구를 통해 기억의 속성에 대해 좀 더 자세히 배울 수 있었다.
.
.
.
뒤이어지는 내용에서는 과잉 기억이라는 것이 나오는데, 이와 관련된 한 예로 ‘서번트 증후군(Savant Syndrome)‘ 이라는 것이 소개된다. 개인적으로는 이번 독서를 통해 처음 들어본 용어인데, 이런 사례가 실제로 있긴 있구나 하면서 흥미롭게 읽을 수 있었다. 암기해야 할 양이 많은 것을 공부할 때는 타의추종을 불허할 정도로 부러운 증후군이지만, 다른 한편으로는 언어 능력과 커뮤니케이션 능력이 부족한만큼 자폐증 환자가 많이 나올 수 있는 증후군이라 일장일단이 있음을 느낄 수 있었다.

다음으로는 ‘메타 기억‘이라는 것이 나온다. 이것은 자신의 기억에 대한 판단을 가리키는 용어인데, 우리가 요즘 흔히 얘기하는 ‘메타 인지‘와도 유사하다는 생각이 들었다.

본문의 내용을 통해 메타 기억은 우리의 제한된 기억 용량을 최대한 활용하기 위해 자신만의 효율적인 기억 방법을 찾아서 최소의 기억 용량으로 최대의 기억을 할 수 있게 만들기 위한 것이라는 생각이 들었다. 또한 자신의 기억이 희미해지는 순간을 포착하여 적절한 시기에 그것을 다시 상기해주는 것도 메타 기억을 잘 활용하는 방법 중 하나로 볼 수 있겠다.

원래 기억의 상기라는 것은, 정말로 일어난 일을 테이프레코더처럼 그대로 비춰내는 것이 아닙니다. 일화 기억 (에피소드 기억)은 상세한 부분까지 모두 기억하고 있는 것처럼 느껴지지만, 그것은 상기하는 과정에서 뇌 안에서 비슷한 다른 경험을 합쳐 만들어진 것입니다. - P148

심리학 분야에서는 상기할 때는 다양한 일을 혼동한다는 것이 확실히 밝혀져 있습니다. - P148

녹조류의 일종은 빛을 감지하면 나트륨 이온을 세포 안으로 들어가게 하는 이온 채널을 가지고 있다. - P148

지금까지 많은 사람은 간단히 말하면, 시냅스의 강도(전달하기 쉬운 정도)가 바뀌고, 바뀐 강도가 유지됨에 따라 기억 정보를 저장한다고 했습니다. 맨 처음 기억을 만들 때는 분명히 시냅스의 강도는 변합니다. 그렇지만 우리 실험에서는 기억을 저장하기 위해서는 강해진 시냅스를 그대로 저장할 필요는 없다는 데이터가 나왔습니다. - P149

결국 한 개의 세포 안의 일련의 시냅스에 특정 기억이 저장되는 것은 아니다, 세포 집단의 시냅스에 저장되는 것도 아니다, 그런 것이 아니라, 서로 연결된 일련의 기억 세포군의 연계(커넥션) 패턴이 어떤 기억을 저장한다는 것이 우리의 주장입니다. - P149

뇌는 시스템입니다. 분자 현상만으로는 정신 현상을 충분히 설명할 수 없습니다. 기억에 대해 말하면, 전체의 신호 전달 경로가 어떤 ‘상태 1‘에서 ‘상태 2‘로 옮겨갑니다. 그리고 ‘상태 2‘에서 안정화합니다. 그로 인해 기억이 생겨 유지되는 것이라고 우리는 주장하고 있습니다. - P149

기억은 결코 ‘본 대로, 들은 대로 남겨 두었다 나중에 정확하게 재생할 수 있는 기능‘은 아니다. 때때로 기억은 바뀌어 ‘거짓을 만드는‘ 경우도 있는데, 이 ‘가짜 기억(false memory)‘은 누구에게나 일어난다. - P150

"섬광 기억이 왜곡되는 이유는 그 후 여러 차례 뇌의 ‘전전두 영역‘에서 상기되고 재편성되기 때문이다" - P152

"원래 ‘언제‘ ‘어디에서‘라는 정보는 사건이 기억될 때 거의 주의가 기울여지지 않는다. 그런데도 불구하고 계속 떠올리려고 한 결과, 정보원(source)을 머릿속에서 검색, 식별하는 능력인 ‘소스 모니터링(source monitoring)‘에 오류가 생긴다." - P152

정확한 기억이 아닌데도 불구하고 확신도는 큰 경우가 있다. - P152

소스 모니터링 능력은 6세 어린이도 어느 정도 지니고 있다. 그러나 3세 이전의 기억은 보통 떠오르지 않는다. 소스 모니터링을 담당하는 뇌의 전전두 영역과 해마, 언어가 발달하지 않은 유아기의 기억 방식은 어른과 다르며, 따라서 어른이 되면 떠올릴 수 없게 된다는 설이 있다. - P152

실제로 경험한 기억인지 아닌지를 판단하는 것을 ‘리얼리티 모니터링(reality monitoring)‘이라고 하는데, 이 판단은 6세 아동에게도 어려운 일이라고 한다. 그 이전의 기억은 거짓이었다 하더라도 판단할 수 없어 사실처럼 생각하는 것이다. - P152

뇌의 전전두 영역이 담당하는 ‘기억의 떠올림‘은 날짜를 알 수 없는 퍼즐 조각을 모아 하나로 조합하는 것에 비유된다. - P152

서술 기억은 의식적으로 떠올려진 ‘현재 기억‘, 비서술 기억은 무의식적으로 상기된 ‘잠재 기억‘과 대략적으로 대응시킬 수 있다. - P154

일화 기억이란 ‘언제‘ ‘어디서‘ ‘무엇을 했다‘는 정보를 포함한,  개인적인 사건의 기억이다. 그리고 언어로 표현할 수 있다는(서술 기억) 특징도 있다. 한편 언어로 표현하기 어려운 기억(비술 기억)에는 기능, 습관 등이 있다. - P154

일화 기억과 기능, 습관 모두 장기 기억의 일종이지만, 일화 기억은 틀리기 쉽고 기능, 습관 등은 좀처럼 잊히지 않는다. - P154

우리가 기억하는 사건의 기억을 ‘즐거운 사건‘ ‘보통 사건‘
‘싫은 사건‘으로 분류하면, 어떤 연구에서든 대체로 즐거운 사건의 기억이 약 50%로 가장 많다고 한다. 보통 사건의 기억은 약 30%, 싫은 사건의 기억은 약 20%라고 한다. - P154

강한 감정을 가지면 일반적으로 기억 정도는 낮아진다. 또 그 기억을 떠올릴 때는 ‘소스 모니터링‘이 실패하기 쉽다. - P154

7가지 기억 오류

①건망(망각이나 병적인 것, Transience)

②부주의(계획을 깜빡 잊음, Absent-Mindedness)

③방해(이름을 까맣게 잊음, Blocking)

④혼란(데자뷰등, Misattribution)

⑤암시(출생시의 일을 기억하고 있다고 생각, Suggestibility)

⑥편향(바이어스 등, Bias)

⑦고집(이른바 트라우마 등, Persistence) - P154

한국에서 출간된 <기억의 일곱 가지 죄악(The seven sins of memory))(한승)에서는 1. 소멸, 2. 정신없음, 3. 막힘, 4. 오귀인(誤歸因), 5. 피암시성, 6. 편향, 7. 지속성으로 번역 - P155

눈 같은 감각 기관은 뇌로 방대한 양의 정보를 입력한다. 우리가 의식하는 것은 그 일부일 뿐이며 게다가 그 일부가 뇌의 해마에 기억된다. 만일 모든 것을 기억한다면 바로 용량을 초과할 것이다. - P154

기억이 바뀌기 쉽다는 점은 사용하기에 따라 유용하기도 하다. 기억은 변하기 쉽다는 바로 그 점으로 인해, 시험이나 어려움 같은 힘든 기억을 세월이 지난 다음 긍정적으로 되새기기도 한다. - P154

‘기억은 항상 정확하다‘라는 말은 잘못된 믿음이다. 평상시에도 사실 우리는 주의를 기울인 것밖에 기억하지 못한다. 예를 들어 50원짜리 동전을 보지 않고 정확하게 그릴 수 있을까? - P155

기억은 삶의 바탕이지만, 오류는 늘 있을 수 있다. 틀리기 쉬운 특징을 잘 살펴, 제대로 대처하고 활용하는 것이 중요하다고 할수 있다. - P155

돌발적으로 마주친 강도 사건은 놀라움과 공포의 감정을 불러 일으킨다. 그런 상황에서는 ‘흉기 주목 효과(터널 시야)‘ 라는 현상이 일어난다. 이 현상은 흉기에 주의가 집중된 나머지, 범인의 얼굴과 복장 등의 배경 정보를 지각할 수 없고 기억조차 하기 어려워지는 것이다. - P155

흉기에 주목하게 되는 메커니즘으로 두 가지 설이 유력하다. 하나는 놀람과 공포가 시각적인 주의의 범위를 좁힌다는 것. 다른 하나는 보통은 있을 수 없는 상황이기 때문에 시각적인 주의가 흉기에 집중된다는 것이다(칼이 부엌에 있으면 아무렇지도 않지만, 만일 침실에 있다면 보통 일이 아니다). - P155

긴장감(스트레스와 각성의 정도)이 너무 강하거나 약해도 기억력(억의 효율)은 떨어진다는 관계성이 알려져 있다. 긴장감에는 최적의 수준이있다. 흉기 주목 효과는 긴장감이 지나치게 강한 상태에 해당한다. - P155

기억은 오감 정보가 입력된 뇌 안의 ‘해마‘가 관장한다. - P155

개인적인 기억이나 강도를 만났을 때처럼 강한 감정을 동반하는 기억에는 급격한 감정 변화, 즉 정동(情動)을 관장하는 뇌 부위가 특히 큰 역할을 한다. 그런 부위의 대표적인 예가 ‘편도체‘이다. 뇌의 좌우편도체가 손상된 환자는 감정에 호소하는 이야기를 들은 1주일 후, 그 이야기에 관한 질문의 정답률이 보통 사람에 비해 낮은 것으로 보고되었다. - P155

해마와 편도체는 진화 과정에서 비교적 일찍 나타난 ‘오래된 뇌(대뇌변연계)‘이며 그것들과 새로운 뇌(대뇌 신피질) 사이에 회로(기억에 관여하는 파페츠 회로, 감정에 관여하는 야코블레프-나우터 회로)가 만들어져 있다. - P155

원주율을 몇 만 자리까지 암기할 수 있는 사람은 무의미한 숫자의 나열을 의미 있는 이야기로 가공해 기억한다. 이와는 달리, 주변의 정보를 가공하지도 않고 그대로 모두 기억하는 능력을 선천적으로 지닌 사람들이 있다. 그런 능력을 ‘과잉 기억(hypermnesia)‘이라고 한다. - P156

우리의 귀와 눈에는 항상 주변에 존재하는 모든 정보가 들어온다. 그러나 그 대부분은 아무런 의미도 가지지 않으므로 의식하지 않는다. 그것은 우리의 뇌가 입력된 정보 가운데 필요한 정보에만 주의를 기울여 선별함으로써 의식적으로 ‘보고‘ ‘듣는 일을 하기 때문이다. - P156

과잉 기억 증후군인 사람들은 이런 의도적인 정보 선별이 불가능하다. 더구나 정보에 특정한 이미지나 감정을 더해 기억하는 것이 아니기 때문에, 방대한 양의 정보가 무기질 정보로서 기계적으로 기록된다. - P156

우리의 기억은 그것이 떠올려져(상기되어) 여러 차례 사용되지 않는 한 서서히 희미해진다. 슬픔이나 힘든 일이 트라우마가 되어 PTSD(외상 후 스트레스 장애)가 나타나는 예외는 있어도, 강한 슬픔과 분노의 감정은 대부분 시간과 함께 조금씩 희미해진다. 그러나 과잉 기억을 지닌 사람은 그런 기억조차 잊혀지지 않아, 그 기억으로 고통받는 경우가 적지 않다. - P156

과잉 기억을 지닌 예 가운데서도 더욱 특이한 예로 ‘서번트 증후군(Savant Syndrome)‘이 있다. 서번트 증후군은 선천적인 것이지만, 드물게 사고 등으로 뇌에 장애를 입어 후천적으로 서번트 증후군에 걸린 예도 있다. - P156

서번트 증후군인 사람(서번트)은 대부분 놀라운 기억력을 지니고 있다. 예를 들어, 눈앞의 사물을 마치 사진을 찍듯이 기억할수 있으며, 세세한 부분까지 상세히 재현해 묘사할 수 있는 사람이 있다. 소리에 대한 예민한 기억력을 지녀, 한번 들은 음악을 세세한 부분까지 재현할 수 있는 사람도 있다. 또 여러 연도의 연월일과 요일을 정확하게 기억해, 무작위로 제시된 과거와 미래 특정 날짜의 요일이 무엇인지 정확하게 답하는 ‘캘린더 계산 능력‘을 지닌 사람도 있다. - P156

서번트는 언어를 관장하는 좌뇌에 선천적으로 어떤 장애가 있어, 그 기능을 우뇌로 보충하려고 하기 때문에 생긴다는 가능성이 유력시되고 있다. - P156

우리의 뇌는 언어와 수학적인 능력을 관장하는 좌뇌와 회화와 음악, 공간적 지각력을 관장하는 우뇌가 뇌들보(뇌량)라는 조직으로 연결되어 있다. - P156

"한쪽 뇌의 기능을 보충하기 위해 다른 쪽 뇌의 기능이 활성화하는 일은 충분히 일어날 수 있다" - P156

실제로 많은 경우, 서번트가 발휘하는 일은 회화와 음악의 뛰어난 우뇌적 기능이다. 한편, 언어 능력과 커뮤니케이션 능력은 불충분한 경우가 많아 학습 장애를 가진 경우가 대부분이다. 자폐증 환자(선천적 뇌 기능 장애로 인해 커뮤니케이션 장애 등을 지님) 가운데 10~25%가 서번트라고 한다. - P156

우리는 보통 매일의 사건(일화 기억)이나 일반적인 지식(의미 기억) 정보를 장기 보존할 때는 대뇌 피질에 보관한다.
한편, 운동 방법이나 습관 같은 무의식적으로 하는 일(절차 기억)은 뇌 안의 대뇌 기저핵에 보관한다. 절차 기억은 일화 기억보다 잘 잊혀지지 않는다는 특징이 있다. 서번트의 놀라운 기억력도 대뇌 기저핵에 보존되어 있을 가능성이 있다. - P157

대뇌 기저핵은 대뇌 피질보다 안쪽에 있다. 설치류에서 영장류로 진화하는 과정에서 대뇌 피질만큼 발달하지 않은 장소로, 진화적으로 보다 오래된 부분이라고 할 수 있다. - P157

‘메타 기억‘이란 자신의 기억에 대한 판단을 가리킨다. 눈앞의 영어 단어의 의미를 모를 때, ‘예전에 기억했던 단어인데 단지 의미가 떠오르지 않는 것이다‘ ‘처음 보는 단어이다‘와 같은 식으로, 일반적인 기억 활동보다 한 단계 위에서 자신의 기억상태를 판단하는 것이 메타 기억이다. - P158

기억을 바탕으로, 보다 효과적으로 기억하는 방법을 생각하거나 기억한 것을 잊지 않게 하는 방법(메모를 하거나 운율맞추기를 하는 것)을 생각하는 능력도 이 메타 기억이다. - P158

메타 기억 능력이 높으면 보다 효율적인 기억 방법을 통해 행동 패턴을 바꾸어 시간을 효율적으로 사용할 수 있다고 한다. 예를 들어, 매일 출근하기 전에 필요한 소지품을 잊지 않기 위해 열쇠와 교통카드, 사원증 등 하나하나의 이름을 기억하기보다 이것을 하나로 묶어 현관에 놓아둠으로써 기억 용량을 절약할 수 있다. - P159

행동을 습관화하는 식으로, 어떤 정보를 어떻게 기억하느냐를 판단함으로써 미래를 보다 정확하게 전망할 수 있게 된다. - P159

메타 기억력이 높은 사람은 기억이 희미해지는 감각도 매우 강하게 느끼기 때문에 가끔 강한 불안과 초조감이라는 스트레스를 느끼는 경우도 있다. - P159

"기억이 희미해지는 스트레스를 해소하려면, 기억이 희미해지는 것을 느낄 때마다 다시 한번 상기하는 방법 등을 통해 기억을 유지하면 좋다." - P159

메타 기억 능력이 높고 낮음에는 개인차가 있으며 어느 정도는 선천적으로 정해져 있다. 그러나 일기나 수첩에 기록하며 자신의 행동과 생각을 스스로 모니터링함으로써 자신이 기억하기 쉬운 방법을 확인할 수 있고 메타 기억 능력을 강화할 수 있다. - P159

인간은 다른 동물에 비해 ‘머리가 유난히 큰‘ 동물이다. 몸에 비해 지나치게 큰 뇌를 가지고 있다. 뇌가 커짐에 따라 인간은 매우 복잡한 신경 네트워크를 갖게 되었다. 인간에게 특히 발달한 것은 대뇌의 전전두 영역으로, 메타 기억도 전전두 영역과 깊은 관련이 있다고 생각된다. - P158


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

이 책의 마지막 부분에서 저자는 ‘캐릭터 마이닝‘ 이라고 해서 나만의 캐릭터를 찾는 시간, 내 인생의 키워드를 찾는 시간을 가질 것을 권한다. 또한 이를 실행하는 데 도움이 될만한 질문 20가지를 엄선하여 이를 몇 가지 카테고리 별로 분류하고 독자들이 이에 직접 답해보면서 자신만의 인생 키워드를 발견하는 작업을 해보기를 권한다. 이것은 저자가 실제로 대학 강의실에서 학생들을 대상으로 수업 시간에 실습용 과제로 내주기도 하는 것이라고 하니 어느 정도 검증된 방법이라고도 볼 수 있겠다.

이 캐릭터 마이닝과 관련하여 지난번 포스팅에서 상당부분을 다루었었고, 오늘은 나머지 부분 중 ‘내가 좋아하는 것들의 키워드 찾기‘라는 소주제에 대한 얘기를 좀 더 살펴보면서 시작해본다.
.
.
.
뒤이어서는 앞서 언급했던 좋아하는 것에 반대되는 것으로서 ‘내가 참기 어려운 것들의 키워드 찾기‘라는 소제목의 글이 나온다. 소위 말해 성질 건드리는 것들이 무엇인지를 곰곰이 생각해보자는 것이다. 이것을 하는 이유는 나 자신이 싫어하고 견디기 힘들어하는 것들을 잘 파악하고 있어야 그러한 일들을 만나게 됐을 때 아예 그 상황을 피할 수 있을 것이고 혹은 피할 수 없다면 개선하는 방법을 찾기 위해 노력할 수 있기 때문이다.

내가 좋아하는 일의 형태나 방식을 알면 그 시간을 좀 더 늘려갈수 있다. 전혀 다른 종류의 직업에서 좋아하는 지점을 찾아낼 수도 있다. 좋아하는 일 하나를 알면 또 다른 좋아하는 일을 찾기도 쉬워진다. - P215

내가 행복을 느끼는 것들의 공통점을 찾는다. - P215

나는 일의 어떤 순간에 보람을 느끼는지 공통점을 찾는다. - P215

나는 어떤 일의 형태가 효율적이라고 느끼는지 공통점을 찾는다. - P216

내가 참기 어려워하는 것들은 무엇인가. 어느 조직, 어느 사람에게나 장점이 있다. 하지만 조직이나 사람과의 관계가 끊어지는 것은 장점이 없어서가 아니라 단점을 견디기 어려워서다. - P216

왜 그렇게 화가 났는지, 내가 어떨 때 큰 슬픔이나 좌절을 느끼는지 생각해볼 수 있다. 그리고 그 일들을 피하거나 개선하는 방법을 찾기 위해 노력할 수도 있다. - P216

큰 변화를 감수해야 하는데도 참기 어려웠던 것들의 공통점을 찾는다. - P217

아주 큰 슬픔을 느꼈던 순간들의 공통점을 찾는다. - P217

화가 나서 참을 수가 없는 것이 있다면 이유를 찾아본다. - P217

키워드를 찾는다는 것은 나 자신을 좀 더 솔직하게 알아보고 특장점을 극대화하는 작업이다. - P218

장점이나 단점은 양날의 검과도 같아서 어떤 장점을 갖고 있다면 반드시 그에 수반되는 단점을 안고 있다. 이때 장점에 집중하고 긍정적인 키워드를 만들어 자신의 모토로 삼으면 된다. - P218

분노나 좌절 같은 경험은 있는 그대로 사용하는 것이 아니라 자신을 보호하는 방안으로 활용한다. 이런 일을 다시 겪을 만한 장소나 사건을 회피하는 지침으로 삼을 수도 있다. - P218

앞으로 할 일들을 상상해보자. 이 키워드들을 더 강화하려면 무엇을 해야 하는지, 이 분야에서 어떤 사람이 되고 싶은지, 가까운 미래에 어떤 일을 해야 할지 등이다. - P218

혹시 마음에 드는 키워드가 부족하다면 그 점들을 확보하기위해 뭘 해야 하는지 고민해보는 것도 좋다. 뭔가 다른 키워드가 하나 더 있으면 좋겠다면 채우고 싶은 것을 상상해보고, 이를 얻기 위해 뭘 해야 할지 계획을 세워보는 시간도 필요하다. - P219

키워드들을 중심으로 내 이력도 다시 정렬해본다. 강점과 약점을 중심으로 나열할 수도 있다. 그리고 이를 활용해 이력서나 자기소개서를 다시 쓸 수도 있다. - P219

이런 시간을 통해 자신의 중심 속성을 찾고 앞으로 하는 일들에 잘 활용할 수 있길 바란다. 자신의 속성에 맞지 않는 일들로 이유도 모른 채 힘들어하는 경우가 있는데, 적어도 나를 알고 있으면 대응할 방법을 생각할 수 있다. - P219

내가 일하고 싶은 직종의 속성을 전부 나열한다. 이 속성이 내 속성과 얼마나 유사한지 파악하는 것이다. 단 하나의 공통점 덕분에 당신은 그 일을 계속하게 될지도 모른다. 자신이 가치를 두고 있는 속성과 하는 일의 속성이 맞닿아 있는 지점을 아는 것이 중요하다. 그럼 당신이 그 일을 해야 할 이유를 하나 더 갖게 된다. - P219

많은 사람들이 자기 일을 좋아하지 않잖아. - P221

앞으로 상황이 달라질 수도 있고 심지어 다른 직업을 가질 수도 있지만, 무슨 일을 하든 일에서 조금이라도 즐거움을 찾으면서 살아가고 싶다. - P222

‘나‘라는 데이터의 분석 결과를 현실과 연결해보면서 직업에서 즐거운 부분들을 찾았으면 한다. 한순간이라도 즐거운 일을 찾는 것이 나와 잘 맞는 일을 찾는 방법중 하나일 테니. - P222


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

지난 포스팅의 마지막 부분에서도 잠깐 언급했지만 이 책의 마지막 챕터에서는 진로 선택시 고려해야 할 사항들에 대해 나름 체계적으로 정리된 질문들과 관련된 내용들이 나온다.

책의 흐름상 갑자기 생뚱맞게 느껴지는 독자들도 있을지 모르겠으나, 이 부분은 저자가 학교에 강의를 나가면서 만났던 학생들과 진로 상담을 통해 느꼈던 점들에 기반하여 그들의 진로선택에 조금이나마 도움이 되었으면 하는 마음으로 썼다고 한다. 개인적으로는 지금 현재 학생 신분인 사람들 뿐만아니라 이직이나 전직 등을 고려하는 사람들에게도 조금이나마 도움이 될 수 있겠다는 생각이 들었다.
.
.
.
이어지는 글에서 재능과 관련하여 저자가 자신의 삼촌과 나눴던 짧은 대화가 나와 있었다. 여기서 저자의 삼촌이 했던 말이 저자뿐만 아니라 독자인 나에게도 큰 울림을 주었다. 핵심은 쉽게 하는 게 적성이고 재능이 있는 거라는 말이었다. 막상 듣고 보니 결코 어려운 말은 아닌데, 의외로 많은 사람들이 이런 생각보다는 뭔가 노력하고 열심을 내서 결과물을 만들어내야 한다는 고정관념에 사로잡혀 내가 쉽게 하는 것의 가치를 등한시하며 살고 있는 건 아닌지 돌아보게 하는 문장이었다.

때론 이렇게 단순한게 어쩌면 가장 현명한 방법인지도 모른다. 너무 복잡하게 생각하면 오히려 제자리에서만 머물고 한 발자국도 움직일 수 없게 된다. 그냥 한 걸음 앞으로 내디디면 뭐라도 되긴 된다. 쉽고 단순하게 생각하고 움직여보자.

나와 같은 업계에 있는 사람과 비교해 내가 특별히 잘하는 것은 무엇인지, 내가 잘한다고 생각하는 사람들의 특장점중 내가 가질 수 있는 것과 갖지 못할 것은 무엇인지, 내가 지금까지 해왔던 일 중 지금 일에 도움이 되는 경험은 무엇인지, 내가 좋아한 일들의 공통점은 무엇인지, 내가 싫어하는 일은 무엇인지, 내가 어떤 가치 때문에 이 일을 하고 있는지 등. - P177

어린 시절 잘했던 게 뭔지 떠올려보면 적성을 발견하는 데 도움이 된다. 일 자체에 대한 재능이라기보다는 타고나는 성향이다. - P183

내가 좋아했던 일의 공통점을 발견 - P183

돌잡이는 우리가 원래 갖고 있는 성향을 알고 싶어 시켰던 게 아닐까? 물론 그냥 잡기 좋은 위치에 있어 잡는 경우도 많겠지만. - P184

어릴 때 좋아했던 일과 현재 내게 만족감을 주는 일의 포인트가 비슷할 수 있다 - P184

같은 일을 하더라도 사람마다 만족감을 느끼는 지점이 다르다. - P184

직업은 바뀔 수 있다. 하지만 사람에게 만족감을 주는 어느 지점, 사람의 성향은 크게 바뀌지 않을 수도 있다. 자신에게 만족을 주는 부분, 희열을 느끼게 해주는 부분, 안정감을 주는 부분이 무엇인지 생각해보면 적성을 찾는 데 도움이 될 것이다. - P185

‘이지 고잉easy-going‘. 느긋하고 태평스러운 것을 말한다. 경쟁이 일상이 된 사회에서 ‘이지 고잉‘이란 단어를 들으면 뭔가 치열하게 살지 않는것 같고 노력하지 않는 것 같은 느낌도 든다. 하지만 생각보다 ‘쉬워 보이는 길‘에 가치가 있다. 무리하지 않고 쉽게 해내는 일이 자신의 적성을 나타낼지도 모르기 때문이다. - P185

쉽게 하는 건 내가 재능이 있기 때문이더라고. 쉽게 하는 게 적성일지도 몰라. - P186

내가 따분하게 느끼는 일이 어쩌면 재능이 있고 잘하는 일이라서 그런 걸지도 모른다고? 그전까지는 그렇게 생각해보지 못했다. - P186

매 순간의 선택이 나를 만든 것일까, 아니면 돌고 돌아 같은 길을 가게 되어 있었던 걸까? 지금의 나는 수많은 경우의 수 중 하나일까? - P187

내가 쉽게 해내는 일, 남들만큼 노력하지 않아도 비교적 좋은 결과를 내는 일, 그래서 큰 노력을 필요로 하지 않고 덜 신난다고 생각되는 일. 이런 생각이 드는 일이 있다면 그 일에 재능이 있는 것인지도 모른다. 내 재능이 남들보다 덜 노력해도 더 쉽게 그 일을 이루게 하는 것일 수도 있다. - P188

만약 내가 남들보다 쉽게 해내고 있는 것이라면? 그래서 주어진 일이 너무 쉽다고 생각하는 것이라면? 다른 일이 필요한 것이 아니라 같은 종류의 일이지만 더 높은 레벨의 일이필요한 상황이라면? 내 적성은 거기에 있을지도 모른다. ‘이지 고잉‘에서 의외의 적성을 발견할 수도 있다. - P188

현재 열정을 잃어버린 상태라면 스스로에게 질문을 던져보자. 이 일이 정말 가치를 못느끼는 일인가? 정말 의미 없는 일인가? 다른 일이 아닌 이 일을 시작한 계기는 뭐였나? 다른 선택이 아닌 지금의 이 선택을 한 조그마한 동기라도 있지 않았나? 지금 필요한 것이 적성에 맞는 새로운 일인지 혹은 좀 더 심화된 일인지 구분해보길 바란다. - P189

일을 잘 못하는 느낌이 든다면, 일단 정말 일을 못하는 사람은 ‘그런 생각조차 하지 않는다‘는 점을 상기할 필요가 있다. 일을 잘하고 못하고를 고민한다는 것 자체가 일을 잘하거나 잘할 가능성이 있다는 뜻이다. 더 잘하고 싶은 마음이 있기 때문에 그런 좌절을 느낀다. 진짜 일을 못하는 사람들은 자신이 일을 잘한다고 착각한다. - P190

일을 잘하고 싶다면 본인이 생각하기에 일을 잘하는 사람들과 자신의 공통점과 차이점을 살펴볼 필요가 있다. 때로는 내가 잘하는 것보다 남이 잘하는 것이 더 커 보인다. 내가 잘하는 건 이미 갖고 있는 것이라 내가 갖지 못하고 잘 못하는 역량이 더 훌륭해 보인다. 그래서 나는 일을 잘 못한다고 생각하는 악순환이 반복된다. 내가 정말 객관적으로 일을 못한다고 평가받는 것인지, 아니면 갖지 못한 역량 때문에 그렇게 느껴지는지 확인해보자. - P190

갖지 못한 역량이 있다면 그 역량을 얻기 위해 노력하면 된다. 적성에 맞지 않는데 그저 욕심을 내는 경우라면 그 역량을 그렇게까지 해서라도 가져야 할 이유를 분명하게 적어본다. 그 이유가 생각보다 분명하지 않을 때도 있다. ‘남들이 다 하니까‘ 같은 이유는 자신의 인생에 그다지 도움이 되지 않는다. 하나의 역량을 갖기 위해 노력한 시간만큼 다른 것을 위해 노력할 시간은 줄어들게 마련이다. 그런데 자꾸만 자신이 갖지 못한 것만 보면서 가지려고 하다가는 스스로가 초라하게만 느껴질 뿐이다. - P190

회사를 다니는 것은 연애를 하는 것과 비슷하다. 똑같은 행동을 하는데 그것을 좋아해주는 사람이 있고 싫어하는 사람이 있다. 내 능력 자체는 전혀 부족하지 않은데 부족하다는 느낌을 주는 회사가 있다. 나를 알아봐 주는 조직을 만나는 건 그래서 큰 행운이다. - P191

달릴 땐 보이지 않던 것들이 걷거나 멈춰 서면 보일 때가 있다. - P191

좋아하는 일의 형태를 끊임없이 확인하라 - P193

자신의 전공이나 동아리 활동, 취미 생활을 ‘어떤 이유 때문에 선택했는지‘ 꼭 생각해보면 좋겠다. ‘그냥‘이라고 생각할 수도 있지만 사람은 반드시 어떤 작은 이유라도 있어야 뭔가를 선택한다. - P193

내 선택에 영향을 주는 이유를 생각해보자는 것이다. 선택의 이유에서 성향이 드러난다. - P193

억지로라도 자신에게 맞는 형태로 의미를 부여하는 작업들이 필요하다. 원래 그런 일이 아니더라도 자신이 좋아하는 형식으로 의미를 부여할 수 있게 하는 것이다. 일종의 합리화인데, 정말로 내게 기쁨을 줄 수 있는 형태로 바꿔야 한다. - P194

나는 이런 일을 중요하게 생각하는데 이런 부분이 채워지면 더 즐겁게 일할 수 있을 것 같다고. - P194

다른 사람들은 어떻게 생각하든 자신에게 의미 있는 형식을확인해야 한다. 남들이 의미 있다고 말해도 본인이 느끼지 못하면 소용이 없다. 반면 남들은 의미가 없다고 생각하는 것 같아도 본인이 의미를 찾으면 그것은 소중한 일이 될 수 있다. - P195

좋아하는 일의 형식, 만족감을 얻는 방식을 찾아야 한다. 의미를 부여할 수 있도록 하는 일을 조금 변형해보는 것도 좋다. 회사와 자신 모두에게 도움이 되는 변화가 일어날지도 모른다. - P195

인턴은 이직에 비해 상대적으로 적은 기회비용으로 자신의 적성을 확인할 수 있는 시간이다. 몇 개월의 인턴 기간 동안 실제로 일하는 사람들을 어깨너머로 볼 수 있고, 자신이 상상하던 것과 실제의 차이를 눈으로 확인할 수 있다. 연봉 계약을 한 뒤 퇴직과 이직을 하는 것보다 위험 부담이 훨씬 적다. - P196

정말 중요한 일을 맡게 된 뒤에는 그 이력들을 바탕으로 다음 행보를 정하게 된다. 좀 더 무거운 과정이 되는 것이다. 인턴은 스스로 판단을 내리기 위한 시간으로서의 가치가 있다. 어떤 분야에서 인턴을했다고 해서 반드시 그 방향으로 경력을 쌓을 필요는 없다. - P196

첫 직장이 중요한 이유는 그 직장에서 한 일을 기반으로 다음 기회가 생기기 때문일지도 모른다. 통념처럼 학벌이나 전공이나 첫 직장이 무조건 중요하다고 주장하는 것은 아니지만 첫 직장에서 업무 스타일을 배울 확률이 높고 거기서 했던 프로젝트나 역량을 바탕으로 다음 일을 결정하게 될 가능성이 크다. - P197

어떤 결과물을 내야 하는지 한 번이라도 경험해본 사람과 아닌 사람은 일의 과정에서도 차이가 있다. - P197

인턴은 ‘경험‘이 생긴다는 점에서도 좋은 기회가 된다. 회사에서 중책을 맡지 않더라도 어떻게 프로젝트가 굴러가고, 어떤 결과를 내는지 잘 살펴봐야 한다. 좋은 결과에 관한 이미지가 있으면 다음에 프로젝트를 맡았을 때 응용할 수 있다. - P197

신입에게 경력을 기대하는 것 자체가 말이 안 되지만 어쩌면 ‘경력 우대‘에게 진짜로 바라는 것은 결과물을 내는 방법에 있어서의 경험일지도 모른다. - P197

할 수만 있다면 아르바이트든 인턴이든 다양한 경험을 해보길 바란다. 요즘엔 너무 정보가 많다 보니 그냥 해보기보다는 정보를 모은 뒤 최선의 선택을 하기 위해 고민하는 경우가 많다. 그러지 말고 그냥 해보면 좋겠다. 상상하는 일과 실제로 해볼 때의 일은 다르다. 경험을 해보는 것이 중요하다. 정보와 경험이 합쳐질 때 더 확신이 생긴다. - P198

이직을 하는 근본적인 이유는 저마다의 유토피아를 찾기 위해서라고 생각한다. 이상적으로 여기는 조직의 모습, 이상적인 자신의 일이 어딘가에 있으리라 기대하며 이직할 확률이 높다. 혹은 연봉이 이유가 될 수도 있는데, 이 역시 자신의 가치를 좀 더 높이 평가하는 곳이 있으리라 생각하는 것과 궤를 같이한다. - P199

이직을 결심했다면 자신이 원하는 것이 무엇인지 확실히 할 필요가 있다. 앞에서도 말했지만 회사는 연인과 같아서 지금 애인의 어떤 점이 마음에 안 들어 그 단점이 없는 새로운 애인을 만나면 또 다른 단점이 보인다. 모든 면이 완벽한 사람은 없듯이 모든 면이 완벽한 회사도 없다. 자신이 원하는 것이 무엇인지 확실히 알고 있다면, 견딜 수 있는 단점이무엇인지 알고 있다면 이직 여부를 결정할 때도 도움이 된다. - P199

속으로만 생각하지 않고 여러 사람을 만나 묻고 답하는 시간은 중요하다. 그런 대화를 통해 내면에 품고 있던 질문의 답을 구할 수 있을지도 모른다. - P200

실제로 임상심리학자가 일하는 모습을 몇 시간이라도 보고 그들의 실제 얘기를 들어본다면 자신의 성향과 맞는지 안 맞는지 미리 고민해볼 수 있다. - P201

데이터를 분석하는 일을 하는 사람에게는 ‘데이터를 갖고 있는 것‘이 무엇보다 중요하다. 물론 데이터를 분석하기 위해 필요한 것은 이 외에도 많다. 데이터를 분석할 수 있는 툴, 기술 지원, 함께 일할 동료, 데이터를 필요로 하는 프로젝트, 조직 문화.. 하지만 이 모든 것은 ‘데이터‘가 있기에 가능하다. 데이터가 없다면 아무리 좋은 툴과 동료가 있어도 무의미하다. - P201

조직은 마치 사람과 같아서 완벽하지 않다고 했다. 장점이 있으면 단점이 있기 마련이라 어느 조직에서든 약간의 결핍을 느끼게 된다. 여기에서 결핍 자체는 문제가 아니다. 이 결핍이 내게 얼마나 치명적인지가 중요하다. 데이터 분석가에게 데이터가 없는 것은 어떤 경우에나 치명적이다. - P201

데이터가 없으면 일은 정말 어려워진다. 데이터를 쌓는 일부터 해야 하기 때문이다. 또 데이터는 쌓일수록 강한 힘을 갖는 속성이 있어서 지금부터 데이터를 쌓는다면 최소1~2년 후에나 의미 있는 일을 할 수 있다. (만약 데이터가 없다면 1~2년 후에도 지금처럼 고민할 수 있기 때문에 지금부터라도 데이터를 쌓아야 한다.) - P202

데이터가 없는 데이터 분석가는 흙이 없는 토기장이, 보석이 없는 보석 세공사다. 뭔가 다른 것으로 대체할 수 있을 것 같지만 데이터는 무엇으로도 대체할 수가 없다. 데이터는 다른 데이터로 대체할 수밖에 없다. 어떤 데이터라도 갖고 있어야 한다. - P202

자기 일의 본질, 자신의 일에서 가장 필요한 것이 무엇인지 생각해봐야 한다. 그것이 결핍되어 있다면 조직에 알려야 한다. 설득하고 이끌어내야 한다. 하루라도 빨리 본질적인 업의 필요를 채워 의미 있는 일을 하기 위해 노력하는 것이 좋다. 의미를 발견하면 조금이라도 재미를 느낄 수 있고, 재밌는 일은 좀 더 오래 잘할 수 있다. - P203

구슬이 서 말이어도 꿰어야 보배다. 그런데 구슬이 없으면 꿸 수가 없다. 데이터가 없는 회사에서 데이터 분석가는 의미를 잃게 된다. - P203

휴가가 생겼을 때 어떤 일을 하느냐에 따라 성향의 차이가드러난다. 귀한 시간과 금전이 제한된 상황에서 자신이 어떤 선택을 하는지, 그 선택을 한 이유는 무엇인지 떠올려보자. - P205

여행지가 새로운 가치관을 심어줄 때도 있다. 평소 만나보지 못했던 것들이 나를 자극하는 것이다. 그때 만난 사람, 사건으로 인해 새로운 곳에서 일할 아이디어를 얻게 되기도 한다. - P205

일에 대한 적성을 파악할 때는 안정적이고 이성적인 성향을 고려하는 것이 더 적합하지만, 사람이 어떤 순간 한계에 다다르면 감정적인 부분이 크게 다가온다. 그리고 인생의 큰 결정이나 변화는 그런 감정적인 순간에 이뤄지기도 한다. 따라서 자신의 감정이 폭발했던 경험을 되새겨볼 필요도 있다. - P206

사람들은 생각보다 자기 자신을 잘 알지 못한다. - P209

내 커리어의 키워드를 찾아보자. 회사를 다닌 적이 있다면 좀 더 구체적인 키워드를 찾기 쉬울 수도 있다. 취업 준비생이라면 앞으로 하고 싶은 일의 키워드와 그 일을 위해 지금까지 해온 일들을 정리해 찾아내면 된다. - P213

키워드는 단순하고 선명한 것이 좋다. 누구나 알아들을 수 있는, 사람들에게 이미지가 좋은 단어들을 중심으로 생각해보자. 결국 여러 단어들의 공통점을 찾는 작업인데, 귀결점 같은 느낌으로 단어를 생각해봐도 된다. ‘이 종착지를 위해 내가 이렇게 여러 단어들을 거쳐왔구나‘ 하는 느낌이다. - P213

일하는 1년 중 단 1분만 큰 행복을 느껴도 괜찮을지 모른다. 그 1분의 기억으로 평생을 살아갈 수 있는 사람도 있다. - P215


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

데이터에서 인사이트를 얻고 이를 유관부서에 효과적으로 전달하는 프로젝트를 할 때는 가장 먼저 프로젝트를 기획하고 관련된 데이터를 적절히 분석한 뒤 유의미한 결과물을 얻기 위한 실행을 해나가야 한다.

오늘 시작하는 부분에서는 크게 ‘기획-분석-실행‘의 과정 중 마지막 실행 단계에서 해야 할 것에 대한 얘기가 나온다. 어떤 프로젝트를 하든 간에 데이터 분석 결과에서 얻은 인사이트를 가지고 업무를 진행했을 때 그것이 회사의 매출을 증진시키는 등의 성공적인 결과를 가져올 수도 있지만 반대로 그렇지 못할 수도 있을 것이다. 성공이든 실패든 어떤 결과가 나오든 간에 그 결과에 대한 철저한 피드백이 중요하다는 게 저자의 생각이다. 다만 이 피드백도 단순히 추상적인 얘기만 오가는 것보다는 결과물과 관련된 데이터에 근거할 때 그 피드백의 가치가 좀 더 높아질 수 있을 것이다.

데이터를 분석한 결과를 토대로 가설을 세우고 그 가설이 맞는지를 지속적으로 검증함과 동시에 개선해나갈 점을 찾아나간다는 점이 과학자들이 하는 일들과 비슷하기에, 저자는 데이터 뒤에 ‘사이언티스트‘ 라는 말을 덧붙인 것 같다. 처음에는 데이터 사이언티스트라는 용어가 그저 멋있어 보이기 위한 영어단어의 조합인줄로만 알았는데, 본문을 읽으면서 그것이 단순히 멋의 문제가 아니라 나름대로 이 업무의 속성이 고스란히 내포되어 있는 말이라는 느낌을 받았다. 비즈니스 영역에서 얼마든지 무궁무진한 가치를 창출해 낼 수 있는 멋진 업무가 바로 데이터 사이언티스트가 하는 일이 아닐까 싶다.
.
.
.
뒤이어지는 내용에서는 데이터를 실제 IT서비스에 반영하는 프로젝트와 관련된 얘기가 나온다.

본문을 읽어보면 이 프로젝트의 일반적인 프로세스가 데이터에서 인사이트를 얻는 프로젝트의 프로세스와 대동소이(大同小異)함을 느낄 수 있다. 물론 세부적인 내용들이 조금씩은 다르지만 큰 맥락 자체는 본질적으로 같기 때문이다.

본문에서는 데이터관련 프로젝트를 크게 2가지 유형으로 나누어서 이론적으로 설명하지만, 실무에 들어가면 여기 나왔던 이론적인 얘기들이 아주 다양한 형태의 업무로 쪼개져서 다가올 것이기에 신경써야할 게 한두가지가 아닐 것이고 이는 결코 만만한 일이 아님을 직감적으로 느낄 수 있었다.

바로 이어서는 IT서비스 데이터 반영 프로젝트 사례로 인터넷 서점의 인터페이스 세팅과 관련된 얘기가 나온다. 이론상으로 뼈대만 훑어보다가 실제 사례를 통해 뼈대에 살을 붙이는 느낌을 받았다. 실무적으로 어떤 식으로 일이 진행되는지 간접적으로나마 느낄 수 있어서 유익했다.
.
.
.
뒤이어지는 글에서는 유능한 데이터 사이언티스트가 되기 위해 필요한 기질에 대한 설명이 나오는데, 저자가 언급한 기질들에 부합하는 독자라면 이쪽 분야에 상대적으로 기본적인 재능이 있는 것으로 판단해도 무방할 듯하다. 물론 실무적인 역량을 위한 노력들이 당연히 수반되어야 훌륭한 데이터 사이언티스트가 될 수 있겠지만 말이다.
.
.
.
오늘 포스팅의 마지막 부분이자 이 책의 마지막 챕터에서는 저자가 강의차 학교에 가서 만나는 수많은 학생들과의 진로 상담을 통해 느꼈던 점들을 간단히 나눈다. 좋은 얘기들이 많이 나오는데, 독자인 내가 느낀 핵심은 일단 뭐가 됐든 관계없이 조금이라도 관심이 생긴 분야가 있다면 약간의 시간을 투입하여 그것과 관련된 간단한 결과물이라도 만들어보라는 것이었다. 이러한 과정을 통해 자신이 그 분야에 맞는 사람인지 여부를 몸소 느낄 수 있기 때문이다.

그리고 다음 포스팅에서 좀 더 자세히 다루겠지만 저자가 속한 데이터 분야든 혹은 이외의 다른 분야든 관계없이 진로 선택시 고려해야 할 사항들에 대해 나름 체계적으로 정리된 질문들과 관련된 내용들이 나온다. 이 내용들은 다음 포스팅에서 좀 더 자세히 다뤄 보겠다.

왜 성공했고 왜 실패했는지 알아야 다음에 다른 환경에서 또 사용할 수 있다. 데이터 사이언티스트가 이 분석 과정에까지 동반해야 ‘데이터가 회사를 위해 일하는 회사‘라고 할 수 있다. - P141

IT기업에서는 아무래도 웹/앱 내 기능이나 구성을 최적화하기위한 분석을 하는 경우가 많은 편이다. - P141

데이터 분석 결과 만들어진 알고리즘이 IT서비스나 웹/앱에 직접 반영되는 프로젝트의 일반적인 프로세스

• 프로젝트 초반 : 기획

1. 기한 내 수행할 프로젝트의 범위를 정한다.

2. 유관 부서의 필요를 듣고 함께 연구해야 할 문제를 정한다.

3. 현재 웹/앱 데이터를 확인하고 필요하다면 추가 데이터를 모은다.

• 프로젝트 중반 : 분석

4. 목적에 맞는 가설들을 검증한다.

5. 가설을 실제 웹/앱에 반영할 수 있는지 구체화한다.

6. 필요하다면 수식이나 알고리즘을 만든다.

• 프로젝트 후반: 실행

7. 개발 담당자들과 반영 여부를 논의한 후 실제 웹/앱에 반영한다. 가능하다면 미리 테스트를 한다.

8. 실행 효과를 데이터로 검증한다. 대안을 미리 만들어두었다면 가장 나은 것을 선택한다.

9. 향후 웹/앱에서 실제 고객들의 반응을 지속적으로 추적하고 필요하다면 모델을 수정·보완한다. - P143

사람에게 인사이트를 전달하는 프로젝트와는 달리 실제로 웹/앱에 분석 모델이 사용되는 경우에는 엔지니어와의 협업이 많아진다. 웹/앱에서 어떤 에러를 만들어내지는 않는지, 상충되는 부분은 없는지 확인하면서 프로젝트를 진행한다. 인문적 역량보다는 기술적 역량이 좀 더 강조될 수밖에 없다. - P143

모든 것이 가능하나 모든 것을 한꺼번에 진행하기는 어렵다. 빠르게 개선되어야 할 시급한 프로젝트, 언젠가 해야 하지만 당장 급하진 않아서 천천히 진행할 중·장기적 프로젝트를 나누는 것도 방법이다. - P145

각 담당자들이 그들의 언어로 필요하다고 생각하는 기능을 얘기할 때 그 ‘원인‘이 무엇인지 파악해야 한다. 말하는 그대로 만들 필요는 없지만 왜 그 기능이 필요하다고 하는지 맥락을 파악하는 것이 중요하다. - P146

각 실무 담당자들이 필요하다고 얘기하는 데는 다 이유가 있는 법인데, 구상하는 것들을 일단 가감 없이 들어보는 것이 좋다. 그리고 그중 가장 선행되어야 할 일이 무엇인지도 의견을 들어본다. - P146

실제 데이터를 모았다면 가설을 검증하면서 분석을 해본다. ...(중략)... 생각한 것이 전부 그대로 드러나지 않을 수도 있는데, 또 다른 관점에서 보면 새로운 발견을 할 가능성도 있다. - P147

개인별로 의미 있는 차이가 나왔다고 해서 모든 것을 반영하기는 어려울 수도 있다. 1명의 사람이라도 행동 특성상으로는 여러 그룹에 속할 수 있기 때문에 어떤 기준을 먼저 보여줘야 할지도 고민해봐야 한다. - P148

동일한 수라 하더라도 책 1,000권의 유사성을 분석하는 것과 1,000명의 구매 패턴을 분석하는 것 중 사람 분석이 더 어려울 때도 있다. - P148

웹/앱에서 어떨 때 어떤 책을 보여줘야 할지 규칙을 만들었다면 기계가 이해할 수 있도록 기계언어로 규칙을 전달해야 한다. - P148

인사이트를 사람에게 전달할 때는 반드시 알고리즘을 만들지는 않는다. 사람의 말로 풀어내는 것이 더 중요하기 때문이다. 하지만 웹/앱에서는 기계가 알아들을 수 있도록 프로그래밍 언어를 사용해 코딩해야 한다. 가상이지만 웹/앱 화면이 움직일때 따라야 할 규칙을 만들어주는 것과 비슷하다. - P149

내가 상상했을 때와 실제로 소비자에게 전달되었을 때 효과가 다르거나 전혀 없을 수도 있기 때문에 가능할 경우 테스트를 해보면 더 좋다. 사람들에게 추천 도서를 보여줬는데 크기가 작거나 화면에서 보이지 않는 귀퉁이에 있어 그 책을 전혀 클릭하지 않을 수도 있다. 혹은 추천 로직이 잘못되면 왜 이런 걸 보여주느냐며 귀찮아하는 경우도 있다. 의도한 대로 화면이 구성되도록 테스트해보면 좋다. - P150

웹/앱 업데이트에 대한 사람들의 반응은 좋을 수도 나쁠 수도 있다. 나쁜 것들은 개선하고 좋은 것들은 더 좋게 만들면서 반응의 차이를 살핀다. 한번 만들고 끝이 아니라 소비자가 원하는 것들을 계속 찾아내야 한다. - P150

웹/앱 개선 프로젝트는 개발 일정이 정해져 있는 경우가 많다. 서비스를 사용하는 사람들에게 개인화 추천을 하거나 가장 효율적인 화면을 보여주거나 구매 편의성을 높여주기 위한 방법을 고민하면서 이를 숫자로 증명하고 모델을 만드는 일을 하게 된다. 이때 개발자들과의 협업은 필수이며 실제로 웹/앱 화면에 반영되는 것을 상상하면서 기획해야 한다. - P151

무엇이든 가능하지만 모든 것을 기한 내에 다 할 수는 없다.
일정 기간 안에 수행할 프로젝트의 범위를 정해야 한다. - P151

지금 분석해야 하는 문제를 정의한다. 예를 들어 고객들이 특정 아이콘을 자주 사용하고 있는지, 사용하고 있지 않다면 개선해야 할지 삭제해야 할지, 그 아이콘을 통해 고객 편의나 수익이 만들어지고 있는지 등 확인해야 할 연구 문제를 구체화한다. - P152

웹/앱이 론칭됐다고 해서 데이터 사이언티스트의 일이 끝난 것은 아니다. 예상치 못한 오류가 생길 수도 있고 실제 고객의 건의에 따라 불편한 점들이 보완될 수 있다. 완제품이 나오면 수정하기가 어려운 실물 제품과 달리 끊임없이 오류를 수정해야할 가능성도 있다. - P155

앞으로 반복적인 일은 점점 더 기계가 대신하게 되고 인간은 그 결과물만 받아보는 일이 점점 더 늘어날 것이다. - P156

머신러닝 자동화 기술Auto ML은 기계학습의 어려운 부분을 블랙박스 영역으로 남겨둔 채 결과를 낼 수 있게 한다. 입력과 결과를 구상할 수만 있다면 중간 부분은 이미 만들어져 있는 쿼리로 해결해주는 것이다. 이런 현상과 함께 그 반대편에서는 인간의 인문학적 판단이 더욱 중요해지리라 예상된다. 시간과 노력으로 하던 일들을 기계가 대신해주는 만큼 사람만이 갖고 있는 고유의 사고력이 더 많이  요구되는 것이다. - P157

기계가 알아서 학습을 하고 있다면 ‘무엇을 학습해야 하는지‘, ‘학습한 데이터로 시장에 무엇을 내놓아야 하는지‘ 같은 결정이 나 자신은 물론이고 다른 기업과의 차이도 만들어낼 수 있다. - P157

가설들과 가능성들을 테스트하는 것을 일반적으로 ‘AB테스트‘라고 부른다. A 조건과 B 조건을 비교한다고 보면 된다.
이때 조건이 꼭 2개일 필요는 없다. - P159

기계가 대신할 수 없는 영역이 분명 아직 남아 있다. 기술이 가져올 환상적인 미래 때문에 간과하는 부분들이 있다. 결국 그 기계를 학습시키는 것도 사람이고 결과를 책임지는 것도 사람이고 기술이 알려주는 데이터를 기반으로 전략을 세우는 것도 사람이며 신제품의 디자인을 결정하는 것도 사람이다. 사람이 해야 하는 최소한의 기능은 계속 남아 있을 것이고, 그 최소한의 기능이 사실 가장 중요한 영역일지도 모른다. 바로 인간의 판단력이나 창의성과 맞닿아 있는 지점이다. - P160

인문학적 사고를 바탕으로 기술을 이해해야 한다. 기술의 발전이 필요 없다는 것도 아니고 인문학이 더 중요하다는 것도 아니다. 기술과 인문은 분리되어 있는 것처럼 보이지만 분명히 함께해야 할 영역이다. - P160

파마를 한 뒤 일정 기간 물을 멀리해야 탱글탱글한 파마머리가 유지된다 - P161

어떤 분야, 그것이 아무리 사소하고 작은 것처럼 보여도 무언가 하나에 깊이 빠진 적이 있는 사람은 남들과 다른 시야를 갖게 된다 ...(중략)... 그리고 그 시야는 인생에 상당히 도움이 된다. 어떤 주제를 깊이 파고들어본 적이 있느냐 없느냐에 따라 다른 분야를 대하는 관점도 달라진다. - P161

전혀 상관없어 보이는 분야의 지식이 내 일에 도움이 되는 순간은 언젠가 찾아온다. - P162

똑같은 문제를 보고 남들과는 다른 당신만의 시각으로 설명할 수 있는가? 꼭 ‘새로운 시각‘일 필요는 없다. 자신만의 관점을 갖고 있는지가 중요하다. - P162

하나 이상의 분야에서 전문가가 되면 자연스럽게 ‘관점‘을 갖게 될 것이다. 자신도 모르는 사이 안목으로 스며드는 것이다. 차에 시동이 걸리지 않을 때 기계공학자는 시동장치를, 전기공학자는 배터리를, 화학공학자는 연료를 생각한다는 얘기가 있다. - P163

회사에 정말로 도움이 되는 자신만의 관점이 있다면 대단한 강점이 될 수 있다. 남의 시각을 복사하는 것이 아니라 나만의 관점으로 해석하는 능력을 가져야 한다. 계산은 기술이 대신해주고 정답은 검색 한 번으로 쉽게 찾을 수 있는 시대이기 때문이다. - P163

코딩은 머릿속에 선명한 이미지가 있을수록 더 빠르게 배울 수 있다. 분석을 잘하려면 내 머리로 상상하고 그 상상을 논리적으로 증명하고 실제로 분석할 수 있어야 한다. - P163

머릿속에 대강이라도 원하는 결과물이 있는 것이 좋다. 이를 위해 여러 데이터를 조합한 결과를 상상할 수 있어야 한다. - P163

데이터로 코딩을 하다 보면 수도 없이 이 데이터와 저 데이터를 연결해야 하는 일이 생긴다. 이렇게 뒤집어보고 저렇게 뒤집어봐야 하는 일의 연속이다. 어떻게 하면 이 테이블과 저 테이블을 연결했을 때 오류가 없을까? 어떻게 하면 의미 있는 결과를 찾을 수 있을까? 이때 머릿속으로 어떤 결과물이 나올지 상상할 수 없다면 창의적인 분석이 어렵다. - P164

데이터의 조합을 머리로 상상하지 못하면 실제로 코딩을 할 수도 없다. 상상한 대로 결과물이 나오지 않으면 나중에 수정할 수 있지만 처음부터 상상을 할 수 없다면 아예 다음 단계로 갈 수가 없다. - P165

전문용어를 쓰자면 엑셀에서 피벗* 기능을 쓸 수 없는 사람이 코딩을 하면서 분석할 가능성은 거의 없다. 먼저 엑셀로 시트간 조합**이나 피벗 등의 원리를 이해해보는 것이 좋다. 엑셀에 있는 표로 상상하기 어렵다면 코딩을 배우기 어려울 수도 있다. - P165

pivot :  데이터를 좀 더 쉽게 분석하도록 요약하는 기능. 행렬 재배치와 연산 등을 할 수 있다. - P165

vlookup : 엑셀에서 특정 값을 찾고 계산하거나 대치할 수 있게 해주는 함수. - P165

상상한 결과물을 만들기 위한 재료는 당연히 데이터다. 날것 상태인 로데이터(raw data)는 정말 작은 단위의 데이터이기 때문에 어떻게 분석하느냐에 따라 같은 데이터로도 수천수만 가지 분석을 할 수 있다. 그 작은 단위의 데이터를 어떻게 조합할지 구체화하기 위해서는 논리적인 사고 단계가 반드시 필요하다. - P165

raw data :  수집한 원래 자료, 즉, 전환이나 가공되기 전 최초의 형태를 지닌 자료. - P165

단계적으로 생각할 줄 알아야 한다 - P166

코딩의 기본은 논리력이다. 단 한 글자, 단 한 줄만 잘못돼도 원하는 결과를 얻지 못할 수도 있다. 남이 작성한 쿼리를 가져다 쓸 때도 자신이 원하는 방법으로 수정해야 하는 경우도 있고, 스스로 수백 수천 줄의 쿼리를 논리적인 단계에 따라 한 줄 한 줄 정성껏 작성해야 하는 경우도 많다. - P166

분자 단위가 어떻게 물질이 될 수 있는지 상상할 수 없는 사람은 스스로 코딩을 하고 쿼리를 작성할 수 없을 가능성이 높다. 낱개의 블록을 이렇게 쌓으면 이런 모양이 나오고, 저렇게 쌓으면 저런 모양이 나온다는 것을 상상할 수 있어야 하나하나 흩어져 있는 데이터를 모아 결과물을 만들 수 있다. - P166

머리로 상상한 것을 가장 빠르게 구체화하는 방법은 바로 상상한 그 사람이 손을 움직여 결과물을 내고 확인하는 것이다. 남에게 시키면 그만큼 기다리는 시간이 필요하고 자신이 원하는 그대로 나오지 않을 가능성도 있다. 시간 지연 없이 자신의 머릿속에 떠오른 것을 확인할 수 있으면 그만큼 더 빨리, 더 나은 결과물을 얻을 수 있다. - P167

자신의 손으로 직접 결과물을 만들어내고 싶다는 동기부여가 있는 사람이 기술을 배울 확률이 높다. 혹은 높은 수준의 기술을 갖지 않더라도 남이 작성한 쿼리를 보고 응용할 수 있을 정도의 학습 의지를 가져야 한다. 자신이 직접 통계적으로 가치있는 쿼리를 작성하고 인사이트를 찾고 모델링을 하고 싶다는 생각을 해야만 데이터 사이언티스트가 될 수 있다. - P167

자신의 경험과 장점을 바탕으로 데이터 프로젝트의 목적을 달성하기 위한 모든 역량을 동원할 수 있는 전문가가 되어야 한다. - P168

학업이나 조직 경험을 통해 집중적으로 얻는 역량들이 있다. 그 모든 경험들이 나중에는 균형을 이루게 된다. - P169

해보는 것만큼 중요한 것은 없다. 한 일에 대한 후회보다 하지 않은 일에 대한 후회가 훨씬 더 오래 간다. 그러니 데이터 사이언티스트가 궁금한 사람이라면 이 책을 읽는 데서 그치지 말고 데이터를 분석해보는 일을 꼭 직접 해보길 바란다. - P175

상상만으로 고민하지 않길 바란다. 딱 10시간만이라도, 엑셀로라도 분석 과정을 경험해보길 바란다. 직업을 선택하는 것은 향후 몇 년 혹은 남은 미래 전체가 걸린 결정을 하는 일이니 신중해야 한다. - P175

데이터 사이언티스트가 되든 되지 않든, 자신이 좋아하는 일을 하길 바란다. 이런저런 이유와 팍팍한 인생 탓에 좋아하는 직업을 갖지 못했다면 현재 직업에서 자신이 좋아하는 지점을 찾아내면 좋겠다. 뭔가를 정리하는 것을 좋아하는 사람인지, 결과물을 만들고 이름을 알리는 데서 희열을 느끼는지, 매일 반복적인 일을 할 때 마음의 안정을 느끼는지 등 분명 자신만이 좋아하는 부분이 있을 것이다. - P175

나를 설명할 수 있는 나만의 키워드를 찾아냈다. - P176


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo