v7 인터페이스, AI 통합 키보드. 사진: NVCC . |
Tri Thuc - Znews 와의 인터뷰에서 Tri Duc(2003년생)은 베트남어 입력 방식을 바꾸기 위해 인공지능을 적용하는 아이디어에 대해 이야기했습니다. 그의 학생 프로젝트인 v7 타이핑 도구는 현재 연구 논문으로 발전하여 권위 있는 AI 학회인 IJCAI 2025에 게재되었습니다.
수십 년 동안 널리 사용되어 왔음에도 불구하고, 텔렉스 또는 VNI 타이핑은 여전히 사용자 경험 측면에서 많은 제약이 있습니다. 따라서 v7은 AI 통합을 통해 베트남어 입력 시간을 단축하는 데 도움이 되는 가벼운 예측 도구로 탄생했습니다.
언어와 기술에 대한 열정
그는 언어와 기술에 대한 사랑으로 호치민시 기술대학교에서 응용 인공지능을 전공하게 되었습니다.
그는 재학 기간 동안 베트남어 대규모 언어 모델(LLM), 소수 민족 언어 번역 소프트웨어, 입학 지원 챗봇 등의 프로젝트에 참여했습니다. "이러한 경험은 탄탄한 지식 기반을 쌓고, AI를 활용하여 지역 사회에 유용한 제품을 만들고자 하는 열정과 열망을 키우는 데 도움이 되었습니다."라고 그는 말했습니다.
Tri Duc은 AI를 실제 생활에 적용하여 가치를 창출하고자 합니다. 사진: NVCC |
또한, 북경어와 광둥어에 대한 배경 지식을 바탕으로 득은 병음/쥐트핑과 베트남어 철자의 상관관계를 파악했습니다. 이 점을 통해 상형문자의 복잡성과는 대조적으로, 중국어 병음 입력 시스템은 한자로 국가명을 입력할 때 "yn"만 입력하면 된다는 것을 알 수 있습니다. 반면 텔렉스나 VNI는 "베트남"이라는 단어를 입력하는 데 10개의 키가 필요합니다.
Duc은 자신의 관찰을 통해 빠르게 소통할 때 사용자들이 종종 첫 자음을 그대로 줄여서 사용한다는 것을 깨달았습니다. 예를 들어 "student"를 "hs"로 표현하는 것처럼요. 그는 이러한 아이디어가 탄생하게 된 상황에 대해 "인간이 이러한 글쓰기 스타일을 쉽게 이해할 수 있다면, AI도 적절한 데이터로 훈련하면 완벽하게 이해할 수 있을 것입니다."라고 말했습니다.
텔렉스나 VNI처럼 보완적인 메커니즘을 사용하는 기존 타이핑 도구를 사용할 때 전체 글자를 입력한 후 악센트를 추가하는 대신, v7은 AI를 사용하여 입력하려는 단어를 제안합니다. 이 기술은 가능한 가장 적은 키로 완전한 단어를 정확하게 예측합니다.
베트남어 철자 구조에서 단어는 초성, 운율, 그리고 성조로 구성됩니다. 예를 들어, "Nguyen"이라는 단어는 "ng", "uyen", 그리고 하강 성조로 구성됩니다. 이러한 원리를 기반으로 v7 타이핑 엔진은 초성 및 성조만으로 완전한 단어를 예측하도록 설계되어, 정확성을 유지하면서도 입력 횟수를 크게 줄일 수 있습니다.
AI에게 베트남어를 가르치는 과제
Duc에 따르면, 가장 큰 과제는 AI가 베트남어를 "이해"하도록 훈련시켜 이 타이핑 도구에 적용하는 것이었습니다. 그는 GPT-2를 기반으로 선택하기 전에 여러 모델을 시도해 보았고, 특히 문맥 이해와 정확한 단어 예측을 위한 트랜스포머 아키텍처를 채택했습니다.
Duc은 기본 아키텍처를 선택한 후, Tokenizer(어휘 인코더)를 직접 구축한 베트남어 어휘로 완전히 교체했습니다. 엔지니어는 포괄적인 처리를 위해 유효하고 철자가 정확한 모든 베트남어 단어를 필터링하여 사용자가 입력하려는 단어를 예측했습니다.
또 다른 과제는 예측 성능과 응답 속도의 균형을 맞추는 것입니다. 컴퓨터와 휴대폰 모두에서 실시간으로 모델을 실행하면서도 최상의 예측을 수행할 수 있을 만큼 강력해야 합니다. 두 달간의 지속적인 테스트 결과, 현재 버전은 사용자가 입력하는 단어의 거의 70%를 정확하게 상위에 표시하며, 지연 시간은 단 0.03초에 불과합니다.
키보드 입력 방식과 관련하여, Duc이 언어학자 Cao Xuan Hao나 Henri Maspero의 여러 연구에 따르면 베트남어에는 6개 성조가 아닌 8개 성조가 있습니다. 이 특징을 활용하기 위해 v7은 일반적인 6개 성조(평성조와 5개의 악센트 성조: 샵, 플랫, 의문, 하강, 헤비) 대신 8개 성조를 사용합니다. 이 키보드에서 "v7"을 입력하면 모델이 "Viet"이라는 단어를 제안합니다. 이는 제품 이름에도 반영되었습니다.
Duc은 자신의 소셜 네트워크에 v7을 공유한 후, 이 모델이 관심과 지지를 받고, 직접 체험해 보고 싶다는 욕구를 받았을 때 매우 기쁘고 놀랐다고 말했습니다. "그 덕분에 더 똑똑하고 빠른 베트남어 타이핑 도구가 필요하다는 것을 확실히 깨달았습니다."라고 그는 말했습니다.
과학 연구 논문 저자 그룹. 왼쪽부터: 낫 캉, 히에우 응이아, 트리 덕. 사진: NVCC. |
현재 이 키보드는 프로토타입 단계에 있으며, 프로그래머나 기술 사용자가 테스트하고 기여할 수 있도록 GitHub에 오픈 소스 코드가 공개되어 있습니다. 일반 사용자가 쉽게 설치하고 사용할 수 있도록 Windows 및 macOS용 완전한 애플리케이션 버전도 개발 중입니다.
향후 v7의 최우선 과제는 iPhone용 키보드 버전을 개선하여 스마트폰에서 베트남어 입력 방식을 개선하는 것입니다. 또한, 일상 대화 데이터를 더 많이 학습시켜 모델의 정확도를 높이고, AI가 일반적인 맥락을 더 잘 이해하도록 지원할 것입니다.
덕의 여정은 베트남이 AI 인프라에 막대한 투자를 하는 상황에서 기술 트렌드를 따라잡으며 창의력을 발휘하는 데 기여했습니다. 그가 자랑스러워하는 순간 중 하나는 v7이 최초로 완전한 문장을 만들어냈을 때입니다. 덕은 "그때는 오늘날 ChatGPT 크기의 1만 분의 1 정도밖에 안 되는 작은 모델이 여전히 사람처럼 생각할 수 있었던 때였습니다."라고 말했습니다.
출처: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
댓글 (0)