박충원 두나무 머신러닝팀 연구원이 지난 14일(현지시각) 아털라어 파도바 센트로 콩그레스에서 열린 'SIGIR 2025'에서 포스터 발표를 하고 있다. ⓒ 두나무
[빅데이터뉴스 한시은 기자] 업비트 운영사 두나무(대표 오경석)는 본사 머신러닝(ML)팀의 개인화 뉴스 추천 연구 논문이 세계 최고 수준 정보검색학회 'SIGIR 2025'에 채택, 메인 콘퍼런스에서 발표했다고 17일 밝혔다.
SIGIR(시그아이알·The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval)은 정보검색 분야에서 가장 영향력 있는 국제 학회 중 하나로, 올해 제출된 논문의 약 27%만이 채택됐다.
올해 SIGIR의 메인 콘퍼런스는 지난 7월 13~18일(현지 시각) 이탈리아 파도바 센트로 콩그레스에서 열렸다. 박충원 두나무 머신러닝팀 연구원은 지난 14일 현장에서 두나무가 개발한 개인화 뉴스 추천 시스템 연구 성과를 직접 발표했다.
이번 발표 논문 제목은 'LLM 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론(원문 논문명: LLM as User Simulator: Towards Training News Recommender without Real User Interactions)’이다.
이 논문은 실제 사용자 데이터 없이 LLM(대규모 언어 모델)으로 가상의 이용자를 생성해 학습 데이터를 만들고, 이를 바탕으로 뉴스를 추천하는 방안에 대해 다뤘다. 기존 뉴스 추천 시스템에 필요했던 이용자 로그에 대한 의존도를 대폭 해소했다.
기존 뉴스 추천 방식은 머신러닝 모델의 학습을 위해 클릭 로그나 뉴스 선호도 등의 사용자 데이터를 수집해야 했으나, 이는 대규모 데이터 확보의 어려움과 개인정보 침해 우려 문제가 있었다. 두나무 머신러닝팀은 이를 해결하기 위해 가상의 사용자를 시뮬레이션하는 'LAUS(LLM As User Simulator)’라는 프레임워크를 개발, 새로운 대안을 제시했다.
LAUS는 실제 사용자 데이터 대신 가상의 사용자를 생성해 다양한 상호작용 패턴을 만들어 학습 데이터를 만드는 방식이다. 이를 통해 방대한 데이터를 별도로 수집하지 않아도 고품질 개인화 서비스를 빠르게 구축할 수 있는 가능성이 확인됐다.
박충원 연구원은 "개인화 뉴스 추천 시스템 품질은 이용자가 원하는 정보를 얼마나 정확히 제공하는가와 직결돼 서비스 만족도를 높이는 핵심 요소"라며 "이번 연구를 통해 고객 정보 보호와 운영 효율성을 모두 충족하면서 더욱 정교한 추천 서비스를 제공할 수 있는 기반을 마련하게 돼 기쁘다"고 소감을 밝혔다.
한편, 두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발 중이다.