진화하는 한국식 챗 GPT…거리 넓다
한국경제TV – 퀵경제/주식채널 | 업데이트된 GPT4는 ChatGPT가 출시된 지 불과 4개월 만에 출시되었습니다. 한국도 한국형 채팅 GPT를 개발하고 있지만 격차가 벌어지고 있다는 분석이 나온다.
tv.naver.com
업데이트된 GPT4는 ChatGPT가 출시된 지 불과 4개월 만에 출시되었습니다.
한국은 챗GPT의 한국어 버전을 개발하고 있지만 격차는 더 벌어지고 있는 것으로 분석된다.
자세한 사항은 취재진과 통화해보겠습니다. IT바이오부 정호진 기자입니다.
정 기자, GPT4가 곧 공개되었습니다. 이전보다 나은 점은 무엇입니까?
한마디로 더 똑똑해졌습니다. 더 많은 글을 읽고 더 정확한 답을 찾을 수 있었습니다.
OpenAI는 하위 10%였던 사법시험 점수가 상위 10%로 올라갔고 답변의 정확도와 이해 가능한 글자 수가 크게 증가했다고 밝혔다.
특히 이전에는 읽기만 가능했던 ChatGPT가 이제 이미지를 볼 수 있습니다.
풍선이 많이 달린 사진을 보여주며 ‘끈을 자르면 어떻게 될까?’라고 물었다.
이는 AI가 프레임 안의 상황을 정확하게 파악할 뿐만 아니라 물체가 공기보다 가볍게 떠다니는 개념을 유추할 정도로 뛰어나다는 뜻이다.
그리고 MS오피스와의 협력 소식도 충격적이었습니다.
파워포인트에서 “이 파일을 기반으로 프레젠테이션 만들기”라고 하면 보시는 것처럼 바로 자료가 생성됩니다.
또한 엑셀로 작성된 데이터를 기반으로 데이터를 분석하고 차트를 생성하는 기능을 도입했다.
미래는 생각보다 빠르게 다가오고 있습니다. 국내 빅테크들도 GPT4에 대한 언어모델을 개발하지 않았나요?
최근에는 소식이 거의 없지만 격차가 더 벌어지고 있는 것 같습니다.
좋아요.
1년만에 시작했습니다. OpenAI는 2020년 GPT-3 논문을 발표했고, 네이버와 카카오는 이듬해 자체 모델을 발표했다.
그리고 ChatGPT는 지난해 11월 출시됐으며, GPT-4는 4개월 만에 출시됐다. 하지만 네이버는 오는 7월 하이퍼클로바X를 출시할 예정이다.
카카오는 지난 일요일 KoGPT 기반의 ‘다다움’ 초기 버전을 내놓았지만 과도한 사용자로 인해 이틀 만에 서비스를 종료했다.
개발비 수준의 차이를 감안할 때 그 격차는 더 벌어지고 있는 것으로 보인다.
그렇다면 모델 간의 성능 차이는 어떻습니까?
방금 언급한 세 가지 모델을 비교하면 네이버 언어 모델이 GPT-3보다 약 300억 개의 매개변수가 더 많다는 것을 알 수 있습니다.
더 많은 매개변수를 갖는다는 것은 AI가 더 많은 연구를 하고 정확한 답을 줄 수 있는 더 많은 증거가 있다는 것을 의미합니다.
그렇기 때문에 개발자는 “많을수록 좋다”고 말하지만 매개변수가 많다고 해서 반드시 성능이 좋아지는 것은 아닙니다.
GPT-4의 파라미터는 아직 발표되지 않았지만 큰 차이는 없을 것이라는 목소리가 많다.
예를 들어 문제집을 다 풀었다고 해서 SAT 만점을 받을 수 있는 것은 아니겠죠?
양이 중요하지만 배우는 것처럼 AI 성능은 변수를 변경하고 조정하는 방법에 따라 크게 달라집니다.
하지만 이 과정은 기밀이기 때문에 일반 모델로 흉내를 내려고 해도 GPT4와 같은 품질을 내기 어렵다는 게 업계 설명이다.
취재 중에 들은 말 중에 “모델 간의 품질 차이는 절대 메울 수 없다고 생각한다”는 극단적인 표현이 있었다.
성능의 차이가 있어도 한국어에 특화된 장점을 강조하셨다.
Lutten, Artificial Society 등 국내의 많은 스타트업들이 제너레이티브 AI를 기반으로 다양한 서비스를 제공하고 있습니다.
이러한 스타트업은 한국어 서비스도 제공하지만 GPT4 모델을 사용합니다. 이는 한국어 전문화의 장점도 퇴색하고 있음을 방증한다.
ChatGPT를 시작할 때부터 “영어는 잘하는데 한국어는 못한다”는 말이 있었습니다. 이제 GPT4의 한국어 실력은 과거 영어 못지 않게 높아졌다.
글로벌 VC 관계자는 “한국에서 개발한 언어 모델이 한국어를 더 잘한다는 데 동의하는 사람은 많지 않을 것”이라고 말했다.
그렇다면 국산 모델의 장점이 있을까요?
모델의 성능은 차치하고라도 국산 모델이 가성비 측면에서 더 효율적인 것으로 나타났다.
“GPT”와 같은 언어 모델은 학습된 데이터를 인간의 언어로 변환하는 과정을 거친다.
예를 들어볼까요? “I go to school”이라는 문장을 보면 해외 모델은 각 단어를 단어로 변환하지만 국내 모델은 문장을 의미 단위로 본다.
또한 ChatGPT는 영어에 최적화된 모델이기 때문에 같은 길이의 답변을 한국어로 변경하는 것이 영어보다 약 5배 정도 비용이 더 들지만 하이퍼클로바의 장점은 한국어에 최적화되어 있다는 것입니다.
AI 스타트업의 한 CEO는 “하이퍼클로바에서는 한국어가 영어의 절반 수준”이라고 말했다.
여기에 카카오의 저비용 고효율 전략도 투자 관점에서 긍정적이라는 분석이 나온다.
홍은택 카카오 대표도 최근 실적발표에서 KoGPT의 강점으로 가성비를 꼽았다.
증권업계 관계자는 “비용-편익 전략 성공에 따른 매출 성장은 막대한 비용 투자로 실패보다는 가산점으로 보답받는다”고 설명했다.
여기까지 듣습니다. IT바이오부 정호진 기자였습니다.
진화하는 한국식 챗 GPT…거리 넓다
업데이트된 GPT4는 ChatGPT가 출시된 지 불과 4개월 만에 출시되었습니다. 한국은 챗GPT의 한국어 버전을 개발하고 있지만 격차는 더 벌어지고 있는 것으로 분석된다. 자세한 사항은 취재진과
n.news.naver.com
