November 24, 2025 English Reading
원문
해석
새로운 연구에 따르면, AI 소프트웨어는 일부 언어들로 더 잘 동작한다. 연구자들은 사용자들이 AI 챗봇 시스템의 기반이 되는 대규모 언어 모델 LLM과 확실한 의사를 표현할 수 있는 언어를 사용했을 때 좋은 답변을 받을 수 있다고 전했다. 과학자들은 각각 다른 회사에서 만든 6개의 AI 소프트웨어를 테스트했다. 26개의 언어로 진행했고 AI에게 같은 작업을 시켰다. 그들은 꽤 복잡한 작업을 시켰다. 예를 들면, LLM들에게 많은 양의 데이터를 주고 제자리에 있지 않은 하나의 정보를 찾으라고 지시했다. 연구자들은 다른 언어가 작업에 얼마나 영향을 미치는지에 대해 살펴봤다. LLM에게 맡긴 작업은 수천개 혹은 그 이상의 단어들로 구성된 정보들이였으며, 그들은 폴란드어로 가장 빠르게 발견하여 결과물을 내놓았다. 다음으로는 프랑스어가 87%로 따라왔으며, 이탈리아어는 86%, 스페인어는 85%, 러시아어는 84%를 기록했다. 영어는 84% 이하를 기록했다. 추정치가 가장 적은 세 언어는 스와힐리어, 타밀어, 세소토어로 주로 레소토와 남아프리카에서 사용한다. 세소토는 50% 이하를 기록하였다. 연구자들은 이것은 아마 LLM이 학습하기 위해 필요한 온라인 컨텐츠들이 이 언어들로 만들어진게 적기 때문이라고 전했다. 하지만 폴란드어는 영어와 중국어보다 높게 측정되었으며 온라인에서 폴란드어로 구성된 콘텐츠는 영어와 중국어보다 적다. 게다가 중국어는 아래에서 4번째 순위로 책정되었다. 미래에는 사람들이 모든 언어로 똑같이 좋은 결과를 얻을 수 있기를 바란다.
GPT 교정본
새로운 연구에 따르면 AI 소프트웨어는 언어에 따라 성능 차이가 난다. 연구팀은 사람들이 AI 챗봇의 기반이 되는 대규모 언어 모델(LLM)과 어떤 언어로 소통하느냐에 따라 결과가 달라진다고 말했다.
연구자들은 여섯 개 AI 회사의 소프트웨어를 테스트했다. 그리고 26개 언어의 원어민들이 같은 작업을 LLM에게 시키는 방식으로 평가를 진행했다. 작업은 꽤 복잡했다. 예를 들어, 매우 많은 양의 데이터를 준 뒤 그중 맞지 않는 단 하나의 정보를 찾아내라고 하는 식이었다.
그들은 언어에 따라 LLM의 작업 성능이 어떻게 달라지는지 분석했다. 특히 수만 단어에 달하는 대량의 정보를 처리해야 하는 작업에서, 폴란드어가 가장 높은 성능을 보였고 정확도는 88%였다. 그다음은 프랑스어 87%, 이탈리아어 86%, 스페인어 85%, 러시아어 84% 순이었다. 영어는 84%보다 약간 낮았다.
정확도가 가장 낮은 언어는 스와힐리어, 타밀어, 그리고 레소토와 남아프리카에서 쓰이는 세소토어였는데, 세소토는 정확도가 50% 미만이었다. 연구자들은 이들 언어로 된 온라인 콘텐츠가 부족해 LLM 학습에 쓰일 자료가 적기 때문이라고 설명했다.
하지만 흥미로운 점도 있었다. 폴란드어는 온라인 콘텐츠 양이 훨씬 많은 영어·중국어보다도 정확도가 높았다. 게다가 중국어는 하위권에서 네 번째였다.
연구자들은 앞으로 어떤 언어를 쓰든 동일하게 높은 성능을 얻을 수 있기를 기대하고 있다.
몰랐던 단어
- fourth: 네 번째의
- least: 가장 적은
- belong: 제자리에 위치해있다
- complex: 복잡한