본문 바로가기
Society/도서 정리

데이터 리터러시 (데이터 문해력) - 강양석

by 감마 2022. 10. 19.

데이터 리터러시 (데이터 문해력)

Info

목차

1장. 2020년, 우리가 데이터를 쓰는 모습

  • 80%가 버려지고, 8%만 성공한다 _014
  • 열에 일곱은 믿지 않는 자신의 데이터 _019
  • 엄청난 투자, 그러나 실사용은 고작 21% _024

2장. 디지털 대전환의 열쇠, 데이터 리터러시

  • 대전환의 걸림돌① 데이터 공유하기 싫어요. _028
  • 대전환의 걸림돌② 데이터 읽을 줄 몰라요. _034
  • 걸림돌 제거 작전: 2020년부터 열에 여덟은 데이터 리터러시 집중! _040
  • 데이터 리터러시, 회사 가치를 5% 늘리는 힘 _049

3장. 개척자들의 데이터 리터러시

  • 일반인을 위해, 골고루, 문제해결 중심으로 _058
  • 생각보다 엄중한 데이터 윤리 _063
  • 개척자들의 접근법 _068

4장. 데이터 리터러시 접근법: 말을 배우듯

  • 내게 필요한 데이터 리터러시는 어떻게 결정되는가? _078
  • 개인의 데이터 리터러시는 일상의 문제해결에서부터 _110
  • 조직의 데이터 리터러시는 ‘데이터 놀이’ _114

5장. 데이터 리터러시의 전제조건: 데이터의 힘을 믿습니까?

  • 데이터와 인지력 _122
  • 데이터와 판단력 _153
  • 데이터와 설득력, 그리고 동기부여 _180

6장. 데이터 리터러시 특강: 16가지 실전 역량

  • 데이터 부서에서 자주 들리는 말들 _210
    Ⅰ. 데이터의 이해와 관련된 역량들 _213Ⅱ. 데이터를 잘 확보하는 역량 _260Ⅲ. 데이터를 통해 잘 판단하는 역량 _285IV. 데이터로 소통하기 _318
  • 1) 표현 역량: 차트의 색감만 좋지 내용은 없네요. 화가세요? 2) 스토리텔링 역량: 듣다가 길을 잃었어요. 3) 리포팅 역량: 보고서 쓰러 회사 다녀요? 4) 토론 역량: 아니, 그러니까……아니, 그러니까!
  • 1) 맥락 파악 역량: 누울 자리를 보고 다릴 뻗어라 2) 어프로치 설계 역량: 바다를 끓일 거예요? 3) 데이터 가공 역량: 왔다 갔다 분석하신건가요? 4) 의사결정 원리 적용 역량: 기회비용은 무시한 건가요?
  • 1) 지목 역량: 원하는 게 정확히 뭔지 모르겠어요 2) 수집역량: 넝마주이세요? 3) 대체 데이터 생산 역량: 데이터 없으면 분석 끝나나요?
  • 1) 공감 역량: 뭐 좀 느껴지는 거 없나요? 2) 직관 역량: 숫자가 튀는데요? 3) 사실 파악 역량: 설마, 잘못 읽어서 그런 건 아니죠? 4) 패턴 파악 역량: 결대로 썰어봐요. 5) 비판 역량: 사실인가? 연관이 있는가? 그게 전부인가?

7장. 맺으며: 데이터리터러시닷숍 프로젝트

  • 부록: 메시지별 적합한 12개 차트 유형 _368

P72

  • 2017년 스타인코프에 의해 개발된 데이터 리터러시 성숙도 평가 툴

P83

  • 특히 조직은 구성원 개개인이 문제 해결을 잘 할 수 있는 환경을 조성해줘야 할 의무가 있는데 이를 소흐리 하면 데이터의 양이 점점많아지고, 이종 데이터들이 유통되며, 개인은 적절한 분석으 시도하기가 어려워진다.

P85

  • 2018년 까지 유럽, 아시아, 미국에서 7,377명의 회사내 의사결정자들을 대상으로 실시한 이 조사에 따르면 94%의 응답자가 '데이터 리터러시는 직무 신뢰도를 높이는데 반드시 필요하다' 라고 답했지만, 정작 '데이터를 읽고 쓰고 데이터를 통해 소통할 줄 안다.' 라고 답한 응답자 비중은 C레벨 임원중 32%, 16~24 의 직원들은 그보다 더 낮은 21%에 불과하다.

P88

  • 2016년 전 세계 데이터 사이언티스트를 대상으로 크라우드플라워가 진행한 조사를 보면 데이터 분석 준비 작업이 얼마나 고되고 지루한 일인지를 짐작 할 수 있다. 조사 결과에 따르면 데이터 전문가들조차도 자신에게 주어진 시간의 60% 정도를 분석 준비에 쓴다는데, 일반 직원들이 이런 작업을 하려면 얼마나 긴 시간이 소요되겠느가? 또 이는 조직에 어떤 악영향을 미치겠는가?
  • P92

데이터 마인드

  • 데이터 마인드를 위해 갖춰야 할 첫 번재 자세는 증거주의다. 증거주의의 사전적 의미는 '법률 중에서 증거를 중시 하는 입장이나 견해'다. 데이터는 그 자체가 주장이 될 수 없고 증거를 구성하는 재료다. 따라서 데이터를 활용하고자 하는 모든 동기는 좋은 증거나 근거를 구...

P95

  • 네 번째 자세는 데이터의 힘과 한계를 ㅗㅇ시에 이해하는 것이다. 데이터는 분명 우리의 인지력, 판단력, 설득력 나아가 동기 부여에 도움을 주지만 한편으로 그만큼 조작될 가능성이 높고 제한된 결론만 줄때도 있다. 데이터 자체가 진실을 밝혀내는 분야는 자연과학에 국한되어 있다.

P96

  • 선동은 한문장으로 가능하지만 그것을 반박하는데는 수십장의 문서와 증거가 필요하다. 그리고 그것들을 통해 반박하려 할때 이미 사람드은 선동되어 있다. 분노와 증오는 대중을 열광시키는 가장 강력한 힘이다. 선동의 가장 큰적은 지식인 주의다. 거짓과 진실의 배합은 100%의 거짓 보다 더큰 효과를 내다. 대중은 거짓말을 처음에는 부정하고, 다음에는 의심하지만 결국은 믿게 된다. 여론조사의 결과는 대상을 누구로 잡느냐에 따라 달라진다. - 괴벨스
  • 데이터 사고력
    • 비판적 사고력과 문제해결 사고력이 밀접히 관련되어 있는 이유다. ... 상대의 주장을 받아 들이는 상황이라면 역으로 상대주장의 약화 요인을 충분히 지목할 줄 알아야 한다 데이터의 양과 화려함에만 매몰 된다면 이런 사유 과정을 놓치기 십장이니 반드시 유념해야 할 사항이다.(나느 이러한 역량을 데이터가 근거로서 갖춰야할 '충분성'이라 부르는데) 이에 대해선 ...

P100

  • 일반적인 문제 하결 과정은 크게 1문제 정의 -> 2 가설 수립 -> 3 가설검증 -> 4 소통. 다만 데이터 기반의 문제 해결 과정(DDPS-Data Driven Problem Solving)에선 직관이 아닌 데이터를 활요하는 만큼 이에 특화된 옃가지 역량이 추가 로 필요하다. 가설 검증을 위한 분석 어프로치 걸계, 역량, 어프로치 기반 데이터 확득 역량 데이터 가공 및 가설 진화 역량 및 데이터 커뮤니케이션 역량이 그것
  • 첫번째 - 문제를 인지 하는 단계
  • 두번째 - 그문제가 발생한 이유는 무엇인다
  • 세번째 - 문제를 세분화 및 구조화 하는 단계

P102

  • 나눌분(分), 이해할(析) 이라 했는데 쪼갤석이다. 필자는 한번에 답할 수 없는것을 나누어 답함으로써 전체 답을 찾아가는 문제 해결 방식'. 의역 하자면 그럴 수 있지만 나누고 갈라 낸다의 명확한 의미 전달이 필요하다.
  • 가령'배우자에 대한 당신의 이상형은 어떻습니가?' 라는 질문을 던지면 응답자가 한 번에 답하기가 어려우니 성격, 학력, 경제력, 신앙등 여러 항목별로 나눠 질문 하는 것이 문제의 세분화다. 때문에 '문제를 어떻게 나워서 이해할것 인가' 는 자연스럽게 '문제를 어떤 세부 질문들로 나눌 것이가'에 이어 그렇게 '나뉜 각각의 질문들에 답하려면 어떤 데이터들이 필요한가'와 밀접한 관련을 갖는다.
  • 날카로운 직관은 단번에 생겨지 않는다. 분석없는 분석
  • 여섯번째 - 어프로치(approach), 즉 문제해결을 위한 방법에 접근 하는 단계다. - 맥락적 사고력과 연산적 분석력이 만나는 지점이기때문, 상황 파악하고..가설 정하고, 결과물 가공하고 형상화 해낼 지 생각 하는것은 분석 능령의 영역이다.

P103

  • 어프로치(approach), 즉 문제 해결을 위한 방법에 접근하는 단계다. 일반적인 문제 해결 과정이 아니라 데이터에 기반을 두는 괒어인 만큼 여기에선 데이터의 가공을 지도를 그리는 작업이 이루어진다. ...맥라적 사고력과 연산적 분석력이 만나는 지점 이기 때무이다.
  • 여덟 번째는 데이터 가공에 따른 가설 진화 단계다. 분석을 하다보면 중간 분석 결과가 최초 가설과 배치되는 경우가 종종 있는데. ..미첩하게 기존 가설을 수정하거나 분석 어프로치를 점검 해야한다.
  • 아홉번째 '충분성'확보를 위한 방어 논리를 세우는데 유익하다.
    • 충분한 데이터 레퍼런스 확보 필요
  • 제곱, 분산, 표준 편차.

P107

  • 전문지식을 공유하는 비영리 단체인 센터 포 오픈 사이언스의 설립자 브라이언 노섹은 2015년 '같은 데이터, 다른 결론' 현상에 대한 실험 결과를 발표.
  • '포맷간데이터전환' 누가 알겠는가? 데이터 리터러시라는것도 실은 전문가들을 위한 개념이 아닌, 모두가 데이터로 말하는 습관을 기로고자 하는 캠페인에 가깝다.

P133

  • 세모난 창은 세모난 세상을 둥근 창은 둥근 세상을 보여 주것이다. 먼지 낀 찬은 말할 것도 없이 치명적이다. 데이터는 바로 창(window)다.
  • 데이터의 정량화 -> 정도의 차이까지 인지-> 정확한 인지
  • 구조화 -> 파생된 정보를 새롭게 인지 -> 새로운 인지
  • 정량+구조 -> 패턴화된 정보를 음축적으로 인지 -> 신속한 인지
  • 데이터 서치라이트
  • 픽토그램 (Picture + telegram) 상징문자
  • C커프

P155

  • 예측, 개관성
  • 가공성 : 객관성을 유지한 채 쌓고, 쪼개고 , 합치는 등의 변형이 가능하다는 것이다. 그리고 이변형 과정의 결고물로 도출된 데이터를 엿가락 처럼 늘리면 과거의 확실성을 미래로 연장하는 능력을 얻게 된다. 객관적 집계, 구조화된 가공 그리고 추정, 이것이 데이터가 미래를 탐지하는 가장 기초적인 과정이다.
  • '각 세부 데이터 값에 딸느 최종 값의 변화를 안다'는 것은 곧 '각 세부 데이터 값이 어떻게 변할지에 따라 최종 값이 어떻게 변할지 예측할 수 있다' 는 것과 같은 뜻이다. 이것이 과거를 기반으로 미래를 연장ㅇ하는 작업이다. 만약 우리 회사의 수익구조는 일반적인 회사의 그것보다 좀더 정교하다고 간정..

P171 - 침묵형 거짓말 탐지기

  • 첫 번째는 사실을 사실대로 전달하는,즉 '사실성' 이 있는 정보, 두번째는 그사실이 내가 정말 원하는 메시지 '연관성'을 갖는 정보이다.
  • 중요 정보에 대한 의도적 침묵은 법적으로도 거짓말로 다뤄질 만큼, 어떤 메시지를 전달 혹은 평가할때 충분한 근거를 제시하는것은 매우 중요한 일이다.
  • 단, 한가지 사실만을 근거로 들어 자신의 말하는 바가 진실이라고 주장하는 사람...."이건 명백한 사실 입니다" 라는 말을 의도적으로 반복 한다는 전형적 특징을 띈다. 충분성을 뒤로한채 지엽적 사실의 사실성만 강조하는것이다. 지엽적, 말초적 (가지, 입사귀 엽/끝말, 나뭇가지 끝초)
  • 정보의 양이 증가할 수록 더 경계해야 할 유형의 거짓말은 사실성에 오류가 있는 '명백한 거짓말' 보다는 충분서이 부족한 '침묵형 거짓말' 이다.

p175 - 데이터와 설득력, 그리고 동기부여 - 상처 주지 않는 설득

  • '나는 너에게 설득되는게 아니라, 네가 전달한 사실을 받아 들이는거야' 이렇게 이내 뜻을 같이 하는 반응을 이끌어 내는것이 데이터를 통한 , 상처 주지 않는 설득의 핵심이다.
  • 이런 저격수식 설득이 간으한 이유는 바로 상대가 전개한 논리 구조의 맥을 정확히 공략할 수 있기 때문이다.
  • -> 고객은 나를 신뢰 하는것이 아니라, 데이터를 신뢰하는 것이다.
  • 누구나 적절한 근거를 접하면 생각을 바꿀 여지가 있다. 하지만 내가 원하는 수준만큼 상대를 바꿔 놓으려면 보다 객관적이고 보다 구체적이며 보다 체계적으로 보이는 도구가 필요하고, 그것이 바로 데이터다. '한장의 데이터는 천마디 말보다 강하다'

p189

  • 보안 문제에 접촉 되지 않는 범위에서 구성원들에게 최대한 세심하게 공유한다. .. 바로 자발성이 생겨 난다 -> 다른생각을 할 수 도 있다. 사람마다 다르다.
  • 데이터 투명성을 통해 자발성과 몰입 수준을 관리한다.
  • 노력한 결과가 즉각 자신들의 수치-> SM 의 사업 중요도->프로젝트 인원 추가->성공
  • 한번 성공한 서비스는 시간이 갈수록 고수익을 담보해주고, ... 실험 재원을 보장.. 역으로 이 고리를 한번 놓친 기업은 그러한 기업들의 아성을 깨기가 점점더 어려워진다는 뜻도 되겠다.
  • 자발성 및 투명성
    • 하지만 경영은 늘 연속성 있는 체계여야 함을 고려해보면 이런 방식은 그리 오래가지 않을 가능성이 매우 높다. '투명성으로 자발성을 관리하는것'
  • 설문 조사의 섬세함. - 진짜 검은 의도를 가지고 데이터를 쥐락펴락 하는 살마을 만날 경우는 대비해야 한다. 누군가 재설계된 설문 문한 2번의 결과 데이터 만을 근거로 삼아 당신에게 "여론은 놀이시설을 확충해야 하는데 이를 무시하는겁니가?" 라고 고집흐레 주장할때 그것에 휘말리지 않고 "설문 대상자 범위와 설문 문항 전체를 확인 할 수 잇을까요? 라고 대응

p208 데이터는 우리의 인지, 판단 설득 동기 부여 역량을 강화함.

6장 데이터 리터러시 특강 : 16가지 실전 역량

  • 롱테일 법칙 80:20 우리 회사 매출의 80%는 20%의 고객 덕분, 상위 매출의 20%가 전체 매출의 80%를 차지 한다.

p233

  • 드러나지 않은 유럽지사의 직워수를 파악할 수 있는 능력, 드러나지 않은 유럽 지사의 직원수를 파악 할 수 있는 능력은 요리를 맛본뒤 재료를 판별해 내거나 음악을 듣고 악보를 유추 ..정제된 데이터에서 숨겨진 정보및 사실 관계들을 파악하고 이해하는 능력이 잇는 사람이 보다 정확한 의사 결정도 가능할 것임은 두말 할 나위가 없다.
  • 데이터에 도 결이 있다. 데이터 패턴 파악 역량
  • 왜냐하면' 우리가 데이터 관련 업무를 진행한다는 것은 곧 데이터를 근거 삼아 '왜냐하면'을 보강하고..사실성, 연관성, 충분성

p258

  • 이런 의미에서 봤을때 세사에서 가장 교묘한 거짓말은 사실성을 극대화하고 연광성과 충분성을 교묘하게 숨기는 고도의 거짓말이다. 이런 유형의 거짓말이 늘어나는 것은 사실성 자체에 흠결이 있는 거짓말의 경우 금방 들키기 마련이기 때문이다. 또 사실성을 부각 하는 과정에서 많은 데이터가 동원 되면, 내용이 화려해지는데 이것이 의구심을 발동을 저해하는 측면.
  • 사실성, 연관성과 달리 충분성은 그 적합한 정도가 상대방에 의해 결정된다는 것이다. 상대방의 의심이 폭이 크면 충분성도 그에 맞게 골고루 맞춰야 한다.
  • 좀더 정확히 요청해주세요 -> '나도 바쁘니 당신 상황을 꼼꼼히 이해하고 자료를 건네줄 거란 기대는 하지마, .. 당신은 당신이 뭘 원하는지 잘모르고 있거나, 안다 해도 표현하는데 서투른것 같아' 의 의미
  • 때문에 중요한것은 단순히 정보의 양이 많고 적은가가 아니라 그 정보가 나의 적합한 판단에 정말로 기여 하는가 이다. 답이 정해져 있는 문제일수록 세컨더리 리서치로 해결이 가능하겠지만 모든것이 열린 결말인 문제들에서는 정보와 판단력 모두가 절대적으로 중요하다. 이것이 전략적 사고다.
    1. 도입 : 안녕하세요. 2.시작 : 이러저러한 내용때문에 뵙자고 하였습니다. 3. 유대감 쌓기 . 4. 정보 취합
  • 고급 정보는 팩트 자체를 발견하는 일이 아니라 상대의 의견과 판단을 얻어내는 일
    1. 재확인, 6마무리, 노트 덥고 연필 내려놓기.
  • 아무리 좋은 영어 표현이라해도 상황에 맞지 않으면 잘못 사용하는 셈.

p279

  • 신임 사장 부임 후 역량 평가 가치에 대한 환산 하고 산정하는일.
  • 최근에 수백억 규모로 지어진 롤러코스터가 ROI 관점에서 얼마나 효과적인 투자건이었는지 자체적으로 평가하고 보고 하세요.
  • 복잡하게 얽히고 섥힌 데이터
  • 애초에 데이터를 통해 답을 끌어낼 수 있는 사안이 아니라면 우리가 의존할 수 있는것은 오직 동물적 감각 뿐이다. 설문조사...다중회귀 분석

데이터 획득 영량

  • 대시보드를 보면 서 무엇을 느끼는가?

기획 재정부 발표 자료

  • 공문서 보기 좋아
  • 구조 - 메시지 - 근거 데이터를 매우 잘 포진 시키는 우리나라 공공 조직의 문서 작성 방식이 곧 미래의 문서 작성 방식이라고 자신있는 이유

ppt , 카드 뉴스 , 픽토그램 <--

  • 앞서 이야기 했듯 향후 데이터가 우리 삶과 점점 더 친숙해질 수록 데이터 자체를 화려하게 또는 드러러나게 꾸미는 식의 문서 작성 방식은 줄어들것이다. 그런 사황에서의 핵심은 '어떤 목적을 가진 문서든 주장의 구조와 구조별 메시지, 그리고 그 메시지를 지지하는 근거 데이터를 적절히 포진히켜야한다'는 것임.토론 역량
    • 동일 데이터 다른 해석
    • 모호하고 추상적이라면 애꿎게 서로의 메시지만 자꾸 충돌 하는 상황이 벌어진다. 서로 내놓고 따질 것이 그것밖에 없기 때문인데, 그러다 보면 '지금 싸우자는거야?" 라는 식
    • 모든 사람들이 갖춰야하는 이시대의 능력이 되어버린것.
    • 모든 사람을 데이터 연습 문제 출제자로 만들자.
    • 버블차트 (데이터 문해력)

Info

  • 강양석
  • 목차

1장. 2020년, 우리가 데이터를 쓰는 모습

  • 80%가 버려지고, 8%만 성공한다 _014
  • 열에 일곱은 믿지 않는 자신의 데이터 _019
  • 엄청난 투자, 그러나 실사용은 고작 21% _024

2장. 디지털 대전환의 열쇠, 데이터 리터러시

  • 대전환의 걸림돌① 데이터 공유하기 싫어요. _028
  • 대전환의 걸림돌② 데이터 읽을 줄 몰라요. _034
  • 걸림돌 제거 작전: 2020년부터 열에 여덟은 데이터 리터러시 집중! _040
  • 데이터 리터러시, 회사 가치를 5% 늘리는 힘 _049

3장. 개척자들의 데이터 리터러시

  • 일반인을 위해, 골고루, 문제해결 중심으로 _058
  • 생각보다 엄중한 데이터 윤리 _063
  • 개척자들의 접근법 _068

4장. 데이터 리터러시 접근법: 말을 배우듯

  • 내게 필요한 데이터 리터러시는 어떻게 결정되는가? _078
  • 개인의 데이터 리터러시는 일상의 문제해결에서부터 _110
  • 조직의 데이터 리터러시는 ‘데이터 놀이’ _114

5장. 데이터 리터러시의 전제조건: 데이터의 힘을 믿습니까?

  • 데이터와 인지력 _122
  • 데이터와 판단력 _153
  • 데이터와 설득력, 그리고 동기부여 _180

6장. 데이터 리터러시 특강: 16가지 실전 역량

  • 데이터 부서에서 자주 들리는 말들 _210
    Ⅰ. 데이터의 이해와 관련된 역량들 _213Ⅱ. 데이터를 잘 확보하는 역량 _260Ⅲ. 데이터를 통해 잘 판단하는 역량 _285IV. 데이터로 소통하기 _318
  • 1) 표현 역량: 차트의 색감만 좋지 내용은 없네요. 화가세요? 2) 스토리텔링 역량: 듣다가 길을 잃었어요. 3) 리포팅 역량: 보고서 쓰러 회사 다녀요? 4) 토론 역량: 아니, 그러니까……아니, 그러니까!
  • 1) 맥락 파악 역량: 누울 자리를 보고 다릴 뻗어라 2) 어프로치 설계 역량: 바다를 끓일 거예요? 3) 데이터 가공 역량: 왔다 갔다 분석하신건가요? 4) 의사결정 원리 적용 역량: 기회비용은 무시한 건가요?
  • 1) 지목 역량: 원하는 게 정확히 뭔지 모르겠어요 2) 수집역량: 넝마주이세요? 3) 대체 데이터 생산 역량: 데이터 없으면 분석 끝나나요?
  • 1) 공감 역량: 뭐 좀 느껴지는 거 없나요? 2) 직관 역량: 숫자가 튀는데요? 3) 사실 파악 역량: 설마, 잘못 읽어서 그런 건 아니죠? 4) 패턴 파악 역량: 결대로 썰어봐요. 5) 비판 역량: 사실인가? 연관이 있는가? 그게 전부인가?

7장. 맺으며: 데이터리터러시닷숍 프로젝트

  • 부록: 메시지별 적합한 12개 차트 유형 _368

P72

  • 2017년 스타인코프에 의해 개발된 데이터 리터러시 성숙도 평가 툴

P83

  • 특히 조직은 구성원 개개인이 문제 해결을 잘 할 수 있는 환경을 조성해줘야 할 의무가 있는데 이를 소흐리 하면 데이터의 양이 점점많아지고, 이종 데이터들이 유통되며, 개인은 적절한 분석으 시도하기가 어려워진다.

P85

  • 2018년 까지 유럽, 아시아, 미국에서 7,377명의 회사내 의사결정자들을 대상으로 실시한 이 조사에 따르면 94%의 응답자가 '데이터 리터러시는 직무 신뢰도를 높이는데 반드시 필요하다' 라고 답했지만, 정작 '데이터를 읽고 쓰고 데이터를 통해 소통할 줄 안다.' 라고 답한 응답자 비중은 C레벨 임원중 32%, 16~24 의 직원들은 그보다 더 낮은 21%에 불과하다.

P88

  • 2016년 전 세계 데이터 사이언티스트를 대상으로 크라우드플라워가 진행한 조사를 보면 데이터 분석 준비 작업이 얼마나 고되고 지루한 일인지를 짐작 할 수 있다. 조사 결과에 따르면 데이터 전문가들조차도 자신에게 주어진 시간의 60% 정도를 분석 준비에 쓴다는데, 일반 직원들이 이런 작업을 하려면 얼마나 긴 시간이 소요되겠느가? 또 이는 조직에 어떤 악영향을 미치겠는가?
  • P92

데이터 마인드

  • 데이터 마인드를 위해 갖춰야 할 첫 번재 자세는 증거주의다. 증거주의의 사전적 의미는 '법률 중에서 증거를 중시 하는 입장이나 견해'다. 데이터는 그 자체가 주장이 될 수 없고 증거를 구성하는 재료다. 따라서 데이터를 활용하고자 하는 모든 동기는 좋은 증거나 근거를 구...

P95

  • 네 번째 자세는 데이터의 힘과 한계를 ㅗㅇ시에 이해하는 것이다. 데이터는 분명 우리의 인지력, 판단력, 설득력 나아가 동기 부여에 도움을 주지만 한편으로 그만큼 조작될 가능성이 높고 제한된 결론만 줄때도 있다. 데이터 자체가 진실을 밝혀내는 분야는 자연과학에 국한되어 있다.

P96

  • 선동은 한문장으로 가능하지만 그것을 반박하는데는 수십장의 문서와 증거가 필요하다. 그리고 그것들을 통해 반박하려 할때 이미 사람드은 선동되어 있다. 분노와 증오는 대중을 열광시키는 가장 강력한 힘이다. 선동의 가장 큰적은 지식인 주의다. 거짓과 진실의 배합은 100%의 거짓 보다 더큰 효과를 내다. 대중은 거짓말을 처음에는 부정하고, 다음에는 의심하지만 결국은 믿게 된다. 여론조사의 결과는 대상을 누구로 잡느냐에 따라 달라진다. - 괴벨스
  • 데이터 사고력
    • 비판적 사고력과 문제해결 사고력이 밀접히 관련되어 있는 이유다. ... 상대의 주장을 받아 들이는 상황이라면 역으로 상대주장의 약화 요인을 충분히 지목할 줄 알아야 한다 데이터의 양과 화려함에만 매몰 된다면 이런 사유 과정을 놓치기 십장이니 반드시 유념해야 할 사항이다.(나느 이러한 역량을 데이터가 근거로서 갖춰야할 '충분성'이라 부르는데) 이에 대해선 ...

P100

  • 일반적인 문제 하결 과정은 크게 1문제 정의 -> 2 가설 수립 -> 3 가설검증 -> 4 소통. 다만 데이터 기반의 문제 해결 과정(DDPS-Data Driven Problem Solving)에선 직관이 아닌 데이터를 활요하는 만큼 이에 특화된 옃가지 역량이 추가 로 필요하다. 가설 검증을 위한 분석 어프로치 걸계, 역량, 어프로치 기반 데이터 확득 역량 데이터 가공 및 가설 진화 역량 및 데이터 커뮤니케이션 역량이 그것
  • 첫번째 - 문제를 인지 하는 단계
  • 두번째 - 그문제가 발생한 이유는 무엇인다
  • 세번째 - 문제를 세분화 및 구조화 하는 단계

P102

  • 나눌분(分), 이해할(析) 이라 했는데 쪼갤석이다. 필자는 한번에 답할 수 없는것을 나누어 답함으로써 전체 답을 찾아가는 문제 해결 방식'. 의역 하자면 그럴 수 있지만 나누고 갈라 낸다의 명확한 의미 전달이 필요하다.
  • 가령'배우자에 대한 당신의 이상형은 어떻습니가?' 라는 질문을 던지면 응답자가 한 번에 답하기가 어려우니 성격, 학력, 경제력, 신앙등 여러 항목별로 나눠 질문 하는 것이 문제의 세분화다. 때문에 '문제를 어떻게 나워서 이해할것 인가' 는 자연스럽게 '문제를 어떤 세부 질문들로 나눌 것이가'에 이어 그렇게 '나뉜 각각의 질문들에 답하려면 어떤 데이터들이 필요한가'와 밀접한 관련을 갖는다.
  • 날카로운 직관은 단번에 생겨지 않는다. 분석없는 분석
  • 여섯번째 - 어프로치(approach), 즉 문제해결을 위한 방법에 접근 하는 단계다. - 맥락적 사고력과 연산적 분석력이 만나는 지점이기때문, 상황 파악하고..가설 정하고, 결과물 가공하고 형상화 해낼 지 생각 하는것은 분석 능령의 영역이다.

P103

  • 어프로치(approach), 즉 문제 해결을 위한 방법에 접근하는 단계다. 일반적인 문제 해결 과정이 아니라 데이터에 기반을 두는 괒어인 만큼 여기에선 데이터의 가공을 지도를 그리는 작업이 이루어진다. ...맥라적 사고력과 연산적 분석력이 만나는 지점 이기 때무이다.
  • 여덟 번째는 데이터 가공에 따른 가설 진화 단계다. 분석을 하다보면 중간 분석 결과가 최초 가설과 배치되는 경우가 종종 있는데. ..미첩하게 기존 가설을 수정하거나 분석 어프로치를 점검 해야한다.
  • 아홉번째 '충분성'확보를 위한 방어 논리를 세우는데 유익하다.
    • 충분한 데이터 레퍼런스 확보 필요
  • 제곱, 분산, 표준 편차.

P107

  • 전문지식을 공유하는 비영리 단체인 센터 포 오픈 사이언스의 설립자 브라이언 노섹은 2015년 '같은 데이터, 다른 결론' 현상에 대한 실험 결과를 발표.
  • '포맷간데이터전환' 누가 알겠는가? 데이터 리터러시라는것도 실은 전문가들을 위한 개념이 아닌, 모두가 데이터로 말하는 습관을 기로고자 하는 캠페인에 가깝다.

P133

  • 세모난 창은 세모난 세상을 둥근 창은 둥근 세상을 보여 주것이다. 먼지 낀 찬은 말할 것도 없이 치명적이다. 데이터는 바로 창(window)다.
  • 데이터의 정량화 -> 정도의 차이까지 인지-> 정확한 인지
  • 구조화 -> 파생된 정보를 새롭게 인지 -> 새로운 인지
  • 정량+구조 -> 패턴화된 정보를 음축적으로 인지 -> 신속한 인지
  • 데이터 서치라이트
  • 픽토그램 (Picture + telegram) 상징문자
  • C커프

P155

  • 예측, 개관성
  • 가공성 : 객관성을 유지한 채 쌓고, 쪼개고 , 합치는 등의 변형이 가능하다는 것이다. 그리고 이변형 과정의 결고물로 도출된 데이터를 엿가락 처럼 늘리면 과거의 확실성을 미래로 연장하는 능력을 얻게 된다. 객관적 집계, 구조화된 가공 그리고 추정, 이것이 데이터가 미래를 탐지하는 가장 기초적인 과정이다.
  • '각 세부 데이터 값에 딸느 최종 값의 변화를 안다'는 것은 곧 '각 세부 데이터 값이 어떻게 변할지에 따라 최종 값이 어떻게 변할지 예측할 수 있다' 는 것과 같은 뜻이다. 이것이 과거를 기반으로 미래를 연장ㅇ하는 작업이다. 만약 우리 회사의 수익구조는 일반적인 회사의 그것보다 좀더 정교하다고 간정..

P171 - 침묵형 거짓말 탐지기

  • 첫 번째는 사실을 사실대로 전달하는,즉 '사실성' 이 있는 정보, 두번째는 그사실이 내가 정말 원하는 메시지 '연관성'을 갖는 정보이다.
  • 중요 정보에 대한 의도적 침묵은 법적으로도 거짓말로 다뤄질 만큼, 어떤 메시지를 전달 혹은 평가할때 충분한 근거를 제시하는것은 매우 중요한 일이다.
  • 단, 한가지 사실만을 근거로 들어 자신의 말하는 바가 진실이라고 주장하는 사람...."이건 명백한 사실 입니다" 라는 말을 의도적으로 반복 한다는 전형적 특징을 띈다. 충분성을 뒤로한채 지엽적 사실의 사실성만 강조하는것이다. 지엽적, 말초적 (가지, 입사귀 엽/끝말, 나뭇가지 끝초)
  • 정보의 양이 증가할 수록 더 경계해야 할 유형의 거짓말은 사실성에 오류가 있는 '명백한 거짓말' 보다는 충분서이 부족한 '침묵형 거짓말' 이다.

p175 - 데이터와 설득력, 그리고 동기부여 - 상처 주지 않는 설득

  • '나는 너에게 설득되는게 아니라, 네가 전달한 사실을 받아 들이는거야' 이렇게 이내 뜻을 같이 하는 반응을 이끌어 내는것이 데이터를 통한 , 상처 주지 않는 설득의 핵심이다.
  • 이런 저격수식 설득이 간으한 이유는 바로 상대가 전개한 논리 구조의 맥을 정확히 공략할 수 있기 때문이다.
  • -> 고객은 나를 신뢰 하는것이 아니라, 데이터를 신뢰하는 것이다.
  • 누구나 적절한 근거를 접하면 생각을 바꿀 여지가 있다. 하지만 내가 원하는 수준만큼 상대를 바꿔 놓으려면 보다 객관적이고 보다 구체적이며 보다 체계적으로 보이는 도구가 필요하고, 그것이 바로 데이터다. '한장의 데이터는 천마디 말보다 강하다'

p189

  • 보안 문제에 접촉 되지 않는 범위에서 구성원들에게 최대한 세심하게 공유한다. .. 바로 자발성이 생겨 난다 -> 다른생각을 할 수 도 있다. 사람마다 다르다.
  • 데이터 투명성을 통해 자발성과 몰입 수준을 관리한다.
  • 노력한 결과가 즉각 자신들의 수치-> SM 의 사업 중요도->프로젝트 인원 추가->성공
  • 한번 성공한 서비스는 시간이 갈수록 고수익을 담보해주고, ... 실험 재원을 보장.. 역으로 이 고리를 한번 놓친 기업은 그러한 기업들의 아성을 깨기가 점점더 어려워진다는 뜻도 되겠다.
  • 자발성 및 투명성
    • 하지만 경영은 늘 연속성 있는 체계여야 함을 고려해보면 이런 방식은 그리 오래가지 않을 가능성이 매우 높다. '투명성으로 자발성을 관리하는것'
  • 설문 조사의 섬세함. - 진짜 검은 의도를 가지고 데이터를 쥐락펴락 하는 살마을 만날 경우는 대비해야 한다. 누군가 재설계된 설문 문한 2번의 결과 데이터 만을 근거로 삼아 당신에게 "여론은 놀이시설을 확충해야 하는데 이를 무시하는겁니가?" 라고 고집흐레 주장할때 그것에 휘말리지 않고 "설문 대상자 범위와 설문 문항 전체를 확인 할 수 잇을까요? 라고 대응

p208 데이터는 우리의 인지, 판단 설득 동기 부여 역량을 강화함.

6장 데이터 리터러시 특강 : 16가지 실전 역량

  • 롱테일 법칙 80:20 우리 회사 매출의 80%는 20%의 고객 덕분, 상위 매출의 20%가 전체 매출의 80%를 차지 한다.

p233

  • 드러나지 않은 유럽지사의 직워수를 파악할 수 있는 능력, 드러나지 않은 유럽 지사의 직원수를 파악 할 수 있는 능력은 요리를 맛본뒤 재료를 판별해 내거나 음악을 듣고 악보를 유추 ..정제된 데이터에서 숨겨진 정보및 사실 관계들을 파악하고 이해하는 능력이 잇는 사람이 보다 정확한 의사 결정도 가능할 것임은 두말 할 나위가 없다.
  • 데이터에 도 결이 있다. 데이터 패턴 파악 역량
  • 왜냐하면' 우리가 데이터 관련 업무를 진행한다는 것은 곧 데이터를 근거 삼아 '왜냐하면'을 보강하고..사실성, 연관성, 충분성

p258

  • 이런 의미에서 봤을때 세사에서 가장 교묘한 거짓말은 사실성을 극대화하고 연광성과 충분성을 교묘하게 숨기는 고도의 거짓말이다. 이런 유형의 거짓말이 늘어나는 것은 사실성 자체에 흠결이 있는 거짓말의 경우 금방 들키기 마련이기 때문이다. 또 사실성을 부각 하는 과정에서 많은 데이터가 동원 되면, 내용이 화려해지는데 이것이 의구심을 발동을 저해하는 측면.
  • 사실성, 연관성과 달리 충분성은 그 적합한 정도가 상대방에 의해 결정된다는 것이다. 상대방의 의심이 폭이 크면 충분성도 그에 맞게 골고루 맞춰야 한다.
  • 좀더 정확히 요청해주세요 -> '나도 바쁘니 당신 상황을 꼼꼼히 이해하고 자료를 건네줄 거란 기대는 하지마, .. 당신은 당신이 뭘 원하는지 잘모르고 있거나, 안다 해도 표현하는데 서투른것 같아' 의 의미
  • 때문에 중요한것은 단순히 정보의 양이 많고 적은가가 아니라 그 정보가 나의 적합한 판단에 정말로 기여 하는가 이다. 답이 정해져 있는 문제일수록 세컨더리 리서치로 해결이 가능하겠지만 모든것이 열린 결말인 문제들에서는 정보와 판단력 모두가 절대적으로 중요하다. 이것이 전략적 사고다.
    1. 도입 : 안녕하세요. 2.시작 : 이러저러한 내용때문에 뵙자고 하였습니다. 3. 유대감 쌓기 . 4. 정보 취합
  • 고급 정보는 팩트 자체를 발견하는 일이 아니라 상대의 의견과 판단을 얻어내는 일
    1. 재확인, 6마무리, 노트 덥고 연필 내려놓기.
  • 아무리 좋은 영어 표현이라해도 상황에 맞지 않으면 잘못 사용하는 셈.

p279

  • 신임 사장 부임 후 역량 평가 가치에 대한 환산 하고 산정하는일.
  • 최근에 수백억 규모로 지어진 롤러코스터가 ROI 관점에서 얼마나 효과적인 투자건이었는지 자체적으로 평가하고 보고 하세요.
  • 복잡하게 얽히고 섥힌 데이터
  • 애초에 데이터를 통해 답을 끌어낼 수 있는 사안이 아니라면 우리가 의존할 수 있는것은 오직 동물적 감각 뿐이다. 설문조사...다중회귀 분석

데이터 획득 영량

  • 대시보드를 보면 서 무엇을 느끼는가?

기획 재정부 발표 자료

  • 공문서 보기 좋아
  • 구조 - 메시지 - 근거 데이터를 매우 잘 포진 시키는 우리나라 공공 조직의 문서 작성 방식이 곧 미래의 문서 작성 방식이라고 자신있는 이유

ppt , 카드 뉴스 , 픽토그램 <--

  • 앞서 이야기 했듯 향후 데이터가 우리 삶과 점점 더 친숙해질 수록 데이터 자체를 화려하게 또는 드러러나게 꾸미는 식의 문서 작성 방식은 줄어들것이다. 그런 사황에서의 핵심은 '어떤 목적을 가진 문서든 주장의 구조와 구조별 메시지, 그리고 그 메시지를 지지하는 근거 데이터를 적절히 포진히켜야한다'는 것임.토론 역량
    • 동일 데이터 다른 해석
    • 모호하고 추상적이라면 애꿎게 서로의 메시지만 자꾸 충돌 하는 상황이 벌어진다. 서로 내놓고 따질 것이 그것밖에 없기 때문인데, 그러다 보면 '지금 싸우자는거야?" 라는 식
    • 모든 사람들이 갖춰야하는 이시대의 능력이 되어버린것.
    • 모든 사람을 데이터 연습 문제 출제자로 만들자.
    • 버블차트

'Society > 도서 정리' 카테고리의 다른 글

2003 인터넷 돌아다녔던 명언  (1) 2022.10.15
인터랙티브 디벨로퍼 - 김종민 지음  (0) 2015.10.13

댓글