위의 내용은 VinBigdata의 과학 책임자인 Vu Ha Van 교수가 최근 ViGPT 출시 행사의 sidelines에서 기자들과의 토론에서 공유한 내용입니다.
ViGPT에는 기술 인력과 커뮤니티의 기여가 필요합니다.
부 하 반 교수는 구글과 같은 대기업들이 대규모 언어를 개발할 때 영어나 프랑스어를 주 언어로 선택한다고 말했습니다. 베트남어도 있지만, 검색이나 조회 결과가 다른 언어에 비해 상대적으로 느릴 것입니다. 이러한 대규모 언어 모델이 베트남어 질문에 대한 답변은 어느 정도 완전하고 정확하지 않을 것입니다.
따라서 VinBigdata는 ViGPT가 문화, 역사, 지리 등 베트남 사람들에게 특화된 정보와 직접적으로 관련된 질문에 대한 정확도 면에서 ViGPT를 능가하기를 기대합니다. 이는 베트남어 언어 모델 개발자들이 베트남 사람들에 대한 질문을 할 때 앞으로 바라는 바이며, 외국어보다 더 나은 비교 자료가 될 것입니다.
더 깊이 들어가 보면, VinBigdata의 과학 책임자는 예를 들어 "민감한" 정치적 시기에 쯔엉사와 황사의 역사에 대한 질문을 분석했습니다. Google이나 OpenAI의 답변이 설립자나 해당 기업의 정치적 편향을 반영하지 않는다고 확신하기는 매우 어렵습니다. 베트남에는 다른 선택지가 있는데, 이 문제에 대해 생각해 보는 것이 좋을 것입니다.
"베트남인을 위한 대규모 언어 모델을 구축하는 목적은 베트남인에게 가장 좋은 답변을 제공하는 것입니다. 우리는 그들의 목적을 알 수 없습니다."라고 Vu Ha Van 교수가 말했습니다.
ViGPT가 현재 ChatGPT나 Google Bard만큼 잘하지 못하는 부분이 많다는 점을 인정합니다. 이러한 기업들의 투자 비율과 구현에 소요되는 시간이 수천 배나 더 높기 때문입니다. 그러나 Vu Ha Van 교수는 "6개의 황금 문자가 수놓아진 국기는 누구의 국기입니까?"와 같이 베트남에 편향된 일부 질문에 대해서는 ViGPT가 Tran Quoc Toan의 것이라고 답변할 것이며, 다른 버전은 틀릴 수도 있다고 말했습니다. 앞으로 이와 같은 심층적인 질문을 통해 ViGPT는 국내 사용자들의 피드백을 통해 더 나은 성과를 낼 수 있을 것입니다.
"만약 사용자들이 이 거대한 언어 모델을 비판하거나, 열 살짜리 아이가 모르는 질문을 알고 있거나, 우리가 AI보다 더 똑똑하다는 것을 증명하기 위해 속임수 질문을 던진다고 해서 이 거대한 언어 모델이 여전히 어리석다고 생각한다면, 우리는 AI보다 똑똑하지만, 그것은 어떤 목적을 위한 것이 아닙니다. 우리는 제품을 개선하는 것이 아니라, 제품을 만드는 사람들을 더 슬프게 만들 뿐입니다. 따라서 VinBigdata는 기술 전문가와 커뮤니티의 공동 기여가 필요합니다. 또한, 제품을 완성하는 데 있어 베트남 사람들의 협력이 필요합니다. 그래야 단순한 서비스 도구가 아닌 베트남 사람들의 자부심이 될 수 있습니다."라고 Vu Ha Van 교수는 강조했습니다.
베트남어 모델 지원 및 동반 준비 완료
VietNamNet 과의 인터뷰에서 베트남에서 AI를 개발하는 스타트업 대표들은 VinBigdata의 베트남어 모델을 지원하고 동반할 준비가 되었다고 말했습니다.
Aicontent.vn 플랫폼 소유주인 유니콘 주식회사의 CTO인 딘 쩐 뚜언 린(Dinh Tran Tuan Linh) 씨는 현재 아시아에서 자체적으로 대규모 언어 모델을 성공적으로 훈련하려는 노력을 기울이는 국가가 많지 않으며, 중국, 한국, 일본 등이 그 선두에 있다고 말했습니다. 따라서 ViGPT는 베트남 국민의 핵심 기술 투자 노력에 중요한 신호탄입니다. 딘 쩐 뚜언 린 씨는 "천 마일을 가는 여정은 첫걸음부터 시작해야 한다"며, AI 응용 분야의 선구자인 유니콘은 ViGPT에 기여하고, 테스트하고, 피드백을 제공하고, 적절한 규모의 프로젝트에도 기꺼이 참여할 의향이 있다고 말했습니다.
한편, Lovinbot의 공동 창립자인 당 후 손(Dang Huu Son) 씨는 VinBigdata가 커뮤니티와 전문가의 의견에 귀 기울이는 것이 베트남인을 위한 대규모 언어 모델을 개발하는 데 매우 유익하다고 말했습니다. 기술자로서 당 후 손 씨는 제품 사용 후 VinBigdata 기술팀에 피드백을 제공했습니다.
당 후 손(Dang Huu Son) 씨에 따르면, 새로 출시된 제품은 즉시 완성될 수 없을 뿐만 아니라, 커뮤니티의 전폭적인 지원을 바로 받을 수도 없습니다. 베트남 사람들은 오랫동안 베트남이 해당 기술을 구현할 수 없다고 생각해 왔기 때문에 아직 시간이 필요하다고 생각합니다. 동시에, VinBigdata는 커뮤니티가 어떻게 더 잘 지원하고 함께할 수 있는지에 대한 구체적인 지침을 마련해야 합니다.
마인드메이드 플랫폼 설립자인 당 후 록(Dang Huu Loc) 씨는 현재 전 세계적 으로 모국어 모델을 구축한 국가가 극소수라고 밝혔습니다. 인도처럼 정보 기술이 발달한 부유한 국가나 인도네시아, 중동처럼 베트남보다 GDP가 높은 국가조차도 단순히 원한다고 해서 모국어 모델을 구축할 수는 없습니다. 언어의 특성에 따라 결정되기 때문입니다. 따라서 더 넓은 관점에서 볼 때, 베트남은 모국어 모델 구축에 있어 전략적 우위를 가지고 있으며, 이는 베트남 국민들이 세계적인 경쟁에서 승리할 수 있는 전략적 우위가 될 것입니다.
당 후 록(Dang Huu Loc) 씨에 따르면, 대규모 베트남어 언어 모델을 구축하려는 모든 노력은 가치 있으며, 현재의 단점을 이용하여 국내 기술 부문의 모든 노력을 무시하는 대신, 모델을 매일 더욱 완벽하게 만들기 위한 구체적인 방식으로 이를 개선해야 합니다. 베트남 국민 또한 AI 시대에 대규모 언어 기술의 중요성을 널리 알리고, 이를 자신과 베트남 기업의 가치 창출에 적용하는 방법에 대해 더 많이 논의해야 합니다. 대규모 베트남어 모델을 현재 세계 최고의 대규모 언어 모델과 비교하는 대신 말입니다. 대규모 언어는 일반적인 AI 기술이기 때문에 이 문제에는 적합하지 않을 수 있지만, 다른 특정 문제에는 적합합니다. 특히 대규모 베트남어 모델은 베트남어 이해 및 생성과 관련된 문제에서 더 큰 이점을 가질 것입니다.
[광고_2]
원천
댓글 (0)