본문 바로가기

날적이/잡념

외국 IT 업체들이 한국어에 관심을 보인다



http://www.bloter.net/archives/256006

IBM 인공지능 '왓슨'도 8번째 언어로 한국어를 선택했다고 한다.

SK C&C와 함께 한다는데 한국어를 얼마나 학습할지 궁금하다.


왓슨이란?

http://terms.naver.com/entry.nhn?docId=3329513&cid=40942&categoryId=32828

간단히 말하면 사람이 편한대로 한 말을 분석해서 응답을 하는 인공지능 시스템이다.

얼마 전 알파고 때문에 인공지능에 대한 기사가 나올때 종종 언급이 되었듯이,

현재 대표적인 인공지능 시스템 중 하나로 퀴즈쇼에서 우승해서 더욱 유명해졌다.


아이폰 4S부터 쓸 수 있던 애플의 Siri에서 한국어를 할 수 있고,

구글 번역에도 한국어가 있다.


한국어는 어렵다고 한다. 

내 생각이지만 이건 절대적인 난이도가 아니라 상대적인 난이도인 것 같다.


특히 인공지능 시스템에 관련해서는..


왓슨의 경우

영어, 일본어, 스페인어, 이탈리어, 포르투칼어 등을 했다고 하는데-

일본어는 한국어와 많이 비슷하지만 다른 것들은 유럽의 언어들이니,

유럽의 언어들은 서로 비슷한 점이 많고 

EU의 문서들만 해도 언어간 차이를 분석, 적용하기에 매우 좋을 것이다.

일본어의 경우에도 한국어보다 언어처리 관련 자료나 데이터 수집이 잘 되어 있다.


물론 한국어가 어려운 점이 있다.

높임말도 여러 단계가 있고, 조사와 어미의 발달로 어순도 상대적으로 자유롭다.

하지만 어차피 요즘 기계학습 시스템은 데이터의 양으로 승부를 보게 되므로-

항상 아쉬운건 데이터이다.


사람, 돈, 데이터. 다 아쉬운 것이겠지.


솔직히.. 영어와 중국어도 정말 어렵다고.. =ㅁ=




+.

곁다리로..


지금 막 본 건데 이게 맞는듯 싶은~

알파고는 인공지능 아니다

'날적이 > 잡념' 카테고리의 다른 글

아는 것과 모르는 것의 차이  (0) 2017.09.22
100점 만점에 80점  (0) 2013.07.23
'사용기한'에 대한 잡념  (0) 2013.07.23