토토사이트 펫 바짝 쫓아온 中…미중 최고 토토사이트 펫 성능 차이 1년 새 9.3%→1.7%
입력
수정
7일(현지시간) 미국 스탠퍼드대 인간중심 토토사이트 펫연구소(H토토사이트 펫)가 발표한 ‘토토사이트 펫 인덱스 보고서 2025’에 따르면 토토사이트 펫의 성능을 비교 평가하는 플랫폼 ‘LMSYS 챗봇 아레나’에서 미국과 중국에서 각각 최고 성능으로 평가받은 구글(1385점)과 딥시크(1362점) 간 성능 차이는 지난 2월 기준 1.7%에 불과한 것으로 나타났다. 지난해 1월(9.3%)과 비교해 큰 폭으로 줄어들었다. 오픈토토사이트 펫는 이 평가에서 1366점을 받아 딥시크에는 다소 앞섰지만 구글에는 뒤졌다.
양국 기술 격차는 토토사이트 펫를 평가하는 모든 지표에서 확 줄어든 것으로 나타났다. 대규모 멀티태스크 언어 이해 능력 평가(MMLU)에서 두 나라 최고 성능 모델 간 격차는 2023년 말 17.5%에 달했지만, 지난해 말 0.3%까지 줄어들었다. 과학·예술·공학 등 범용인공지능(AGI)의 기능을 시험하는 벤치마크(MMMU) 격차는 같은 기간 13.5%에서 8.1%로 감소했다. 또 수학 풀이 성능(24.3%→1.6%로), 다중언어코드 생성 평가(31.6%→3.7%) 등에서도 미·중 양국 간 기술 격차는 큰 폭으로 줄었다.
중국은 이미 컴퓨터과학 분야 논문과 토토사이트 펫 특허 수에선 미국을 앞지른 것으로 나타났다. 이 보고서에 따르면 2023년 전 세계 컴퓨터 과학(CS) 분야 논문 중 중국의 논문 비중이 23.2%로 미국(9.20%)을 크게 앞질렀다. 또 중국은 지난해 전체 토토사이트 펫 특허의 69.7%를 차지한 것으로 나타났다.
토토사이트 펫 기술이 고도화되며 지난해 출시된 토토사이트 펫 모델 수는 미·중 양국 모두 줄어든 것으로 나타났다. 해당 보고서는 중국이 지난해 출시한 주목할 만한 토토사이트 펫 모델 수가 15개로 2022년(20개) 대비 5개 줄어들었다고 밝혔다. 미국의 감소폭은 더욱 컸다. 미국이 출시한 토토사이트 펫 모델 수는 2022년 70개에서 작년 40개로 줄었다. 한국의 주목할 만한 토토사이트 펫 모델 수는 단 한 개로 집계됐다.
실리콘밸리=송영찬 특파원 0full@hankyung.com