☆데이터 중심 AI(Data-centric AI)가 향후 과제이다(앤드류 옹, AI 4대 석학)
☆향후 30년 DT(Data Technology)시대가 될 것이다(마윈, 알리바바 창업자)
☆쓰레기 들어가면 쓰레기 나온다(GIGO: Garbage In, Garbage Out)
데이터가 중요하다는 말은 누구나 쉽게 하지만 투자 등 행동으로 직접 하지는 않았다. 알고리즘 개발에 사활을 거는 빅테크 중 최근 Meta가 140억불에 SCALE AI사(AI 학습을 위한 '데이터' 라벨링 전문)를 인수하며 데이터 시대에 본격 들어섰다.
지식 축적의 근간인 Data Age가 도래했지만 특히 비정형데이터(97%이상)가 중요하며, 빅데이터를 기반으로 한 AI시대에는 목적에 맞는 정합성 데이터가 관건이다.
AI 세상 성공을 58명 기술독립군 전문가 의견을 바탕으로 경험/지식 : 데이터Set : 솔루션 비중(%)을 확인한 바 아래와 같다.
1)경험/지식이 최고 중요하다는 인식 60%
2)데이타가 솔루션보다 중요하다는 인식 80%
3)개발자는 솔루션 비중이 제일 크다고 인식
4)통합+균형 요소가 없는 AI는 Risk 크다
인터뷰 요약
1)손정의가 문재인대통령 만나 강조한 첫째 AI, 둘째 AI, 셋째 AI를 위한 조언 대신에 첫째도 (Proper) Data, 둘째도 (Reliable) Data, 셋째도 (Continous) Data이어야 한다
2)y=f(x), 열매=땅(씨앗): 땅이 아무리 옥토라도 쭉쟁이 씨앗이 심어지면 열매가 안열린다.
3)프로젝트에서 대개 솔루션 위주로 진행하여 가치(성과)창출은 불가하며 'Data(마음 포함) to Value' 프로세스가 성공 핵심이다.
4)4차 산업혁명시대 원유는 Data이다. 정제과정이 나쁘거나 원유가 나쁘면 유사휘발유가 유통되어 차량 고장 및 환경오염의 원인이 된다.
5)어떤 목적으로 데이터를 사용할 것인가(合目的性)에 따른 整合性(정리정돈 되어 모여진 성질)이 전제되지 않으면 신뢰할만한 데이터가 아니며, 지속적인 가치창출(Reliable Data to Continuous Value)이 힘들다
6)결론
Back to the Basics(경험/태도)
Back to the Data(기술)
(인간)경험/태도-> Data-> Bigdata-> AI(가치 창출)-> Blockchain(가치 공평배분) 흐름에서 첫 단추가 잘못되면 모든 게 허사이다
※사전 학습과 사후 피드백(배운 점, 느낀 점, 실천할 점) 참여도 높은 2분을 선정하여 K-공철학 책을 타인에게 기부하여 다함께 참여토록 활성화 합니다(돈 가는 곳에 마음간다)
☆데이터 중심 AI(Data-centric AI)가 향후 과제이다(앤드류 옹, AI 4대 석학)
☆향후 30년 DT(Data Technology)시대가 될 것이다(마윈, 알리바바 창업자)
☆쓰레기 들어가면 쓰레기 나온다(GIGO: Garbage In, Garbage Out)
데이터가 중요하다는 말은 누구나 쉽게 하지만 투자 등 행동으로 직접 하지는 않았다. 알고리즘 개발에 사활을 거는 빅테크 중 최근 Meta가 140억불에 SCALE AI사(AI 학습을 위한 '데이터' 라벨링 전문)를 인수하며 데이터 시대에 본격 들어섰다.
지식 축적의 근간인 Data Age가 도래했지만 특히 비정형데이터(97%이상)가 중요하며, 빅데이터를 기반으로 한 AI시대에는 목적에 맞는 정합성 데이터가 관건이다.
AI 세상 성공을 58명 기술독립군 전문가 의견을 바탕으로 경험/지식 : 데이터Set : 솔루션 비중(%)을 확인한 바 아래와 같다.
1)경험/지식이 최고 중요하다는 인식 60%
2)데이타가 솔루션보다 중요하다는 인식 80%
3)개발자는 솔루션 비중이 제일 크다고 인식
4)통합+균형 요소가 없는 AI는 Risk 크다
인터뷰 요약
1)손정의가 문재인대통령 만나 강조한 첫째 AI, 둘째 AI, 셋째 AI를 위한 조언 대신에 첫째도 (Proper) Data, 둘째도 (Reliable) Data, 셋째도 (Continous) Data이어야 한다
2)y=f(x), 열매=땅(씨앗): 땅이 아무리 옥토라도 쭉쟁이 씨앗이 심어지면 열매가 안열린다.
3)프로젝트에서 대개 솔루션 위주로 진행하여 가치(성과)창출은 불가하며 'Data(마음 포함) to Value' 프로세스가 성공 핵심이다.
4)4차 산업혁명시대 원유는 Data이다. 정제과정이 나쁘거나 원유가 나쁘면 유사휘발유가 유통되어 차량 고장 및 환경오염의 원인이 된다.
5)어떤 목적으로 데이터를 사용할 것인가(合目的性)에 따른 整合性(정리정돈 되어 모여진 성질)이 전제되지 않으면 신뢰할만한 데이터가 아니며, 지속적인 가치창출(Reliable Data to Continuous Value)이 힘들다
6)결론
Back to the Basics(경험/태도)
Back to the Data(기술)
(인간)경험/태도-> Data-> Bigdata-> AI(가치 창출)-> Blockchain(가치 공평배분) 흐름에서 첫 단추가 잘못되면 모든 게 허사이다.
※사전 학습과 사후 피드백(배운 점, 느낀 점, 실천할 점) 참여도 높은 2분을 선정하여 K-공철학 책을 타인에게 기부하여 다함께 참여토록 활성화 합니다(돈 가는 곳에 마음간다)
247차 본근한(3ㄴ): 데이터
1)본질: 상대세계에서 구별하여 표현하는 수단
2)근거: 우주와 인간을 이해하기 위한 이미지, 소리, 숫자, 글씨, 냄새 등 정보의 기본 단위(Datus의 복수 Data)
3)한계: 수많은 종류와 분량의 데이터를 통합하여 이해하려는 '지식'으로서는 전체 통찰이 불가하기에 시공간이 없는 절대세계에서의 '지혜'가 융합해야만 한다
K-空철학 47강(데이터) 피드백
======≈==========
1.
김광석박사
1)배운 점: 4차 산업혁명시대 원유는 비정형데이터가 주류를 이룬다.
2)느낀 점: Back to the Basics(현장 경험/태도)-경험이 주류이다.
Back to the Data(기술)-인문학과 협업 필요
3)실천할 점: 인류에게 다가온 인공지능 특이점에서 우리가 할 일을 찾는다.
2.
차석근대표
1)배운 점: 비정형 데이터 중요성
2)느낀 점: 업종별 경험(암묵지) 데이터와 형식지화
3)실천할 점: 표준화 구축
3.
김재유대표
1)배운 점: 데이터 처리와 분석은 단순 기술을 넘어 철학적·인문학적 통찰, 자동화, 경험의 통합 등 다차원적 접근이 필요함을 배웠다.
2)느낀 점: 현장의 데이터 활용은 정제·정렬 같은 기본기가 필수이며, 인간의 감각과 인공지능의 만남에서 새로운 가치가 창출될 수 있음을 느꼈다.
3)실천할 점: 앞으로 데이터 수집·정제 과정에서 인문학적 시각과 기술적 방법론을 동시에 적용해 실제 문제 해결에 적극 활용하겠다.
4.
이경희대표
1)머리로 배운 점: 알고리즘 개발에 사활을 거는 빅테크 지혜를 깨닫는 영성부분이 DATA다.
2)심장으로 느낀 점: 귀로 마음으로 온 몸으로 맞이해야 얼이 사는 결국 마음의 주인에게 돌아온다
3)손발로 실천할 점: 과학과 기술면 데이타를 알아야 Al를 아는 것 처럼 신산업의 모태 상상하지 못했던 방식으로 새로운 관점 바로 지금 절박함으로 시각화해야겠습니다.
5.
청석 이두표대표
1)배운 점
인공지능 시대에는 99% 이상이 비정형데이터로 구성되어 있어, 데이터를 정제·구조화하는 과정이 분석보다 더 많은 시간을 차지함을 배웠습니다.
데이터는 단순한 도구가 아니라 목적과 맥락에 맞는 정합성 있는 형태로 존재해야만 AI가 제대로 작동하고 가치 있는 의사결정을 도출할 수 있다는 것을 배웠습니다.
2)느낀 점
그동안 간과했던 '경험 기반의 비정형 데이터'가 AI의 핵심 연료라는 사실이 인상 깊었고, 인간의 직관과 결합될 때 AI의 진정한 힘이 발휘된다는 점이 놀라웠습니다.
데이터는 그 자체로는 가공되지 않은 원유와 같으며, 분석과 해석, 통합적 사고가 더해져야만 실제로 의사결정과 가치 창출로 이어질 수 있음을 느꼈습니다.
3)실천할 점
기술 중심의 AI 학습뿐 아니라, 인문학적 소양과 경험 데이터를 함께 통합하여 문제를 보는 시야와 분석 역량을 키우는 노력을 실천하겠습니다.
AI에 보다 공부를 지속적으로 하여 “인공지능 기본과정”의 강좌를 두달안에 런칭하겠습니다.
6.
오병운박사
1)배운 점: AI 시대, Back to the Basic 하면, 결국 양질의 Data 중요
a. 풍성한 데이타 필요- 비정형데이타 수용 - 마음까지도 Data 화 해야
b. 신뢰할 수 있는 데이타
c. 합 목적성을 가진 데이타
d. Data 주권이 보장된 데이타 - 테크 달린
2)느낀 점: AI 시대에 나와 우리의 미래는? 내 데이터는?
3)적용할 점: 나만이 가질 수 있고, 줄 수 있는 Data 찾기
7.
최관영박사
1)배운 점 :
•
AI는 엔진이고, Data는 연료이다. 좋은 데이타가 들어가야 좋은 결과가 나온다. Y=f(X) Reliable data X가 들어가야 Successful Result Y가 나올 수 있다.
•
비정합성 data를 버려야하고, 이를 위해 정리정돈 할 수 있는 전문가가 개입되어야 한다.
2)느낀 점 :
•
AI 시대에 경쟁력을 가지기 위해서는 차별화된 Data가 필요하다.
•
경험, 지식에 기반한 data가 중요하며, 이를 위한 인문학적 소양이 필요하다.
3)실천할 점:
•
AI 시대에서 나노 분야에서 혁신할 수 있는 경쟁력 있는 차별화된, 지혜로운 data를 만들기 위해 지관하면서 통찰력을 키워야겠다.