저자: Wenxiao Wang, Lihui Gu, Liye Zhang, Yunxiang Luo, Yi Dai, Chen Shen, Liang Xie, Binbin Lin, Xiaofei He, Jieping Ye | 날짜: 2024 | DOI: N/A
문헌 데이터베이스 구축 파이프라인. PDF 파서로 논문 섹션을 추출하고 LLM으로 요약한 후 임베딩으로 인코딩하여 데이터베이스에 저장
LLM 기반 과학 논문 아이디어 생성 시스템으로, 의미론적(semantic) 문헌 검색과 이중 경로(dual-path) 아이디어 생성을 통해 더욱 참신하고 실현 가능한 연구 아이디어를 제안한다. 기존의 키워드 기반 검색의 한계를 극복하고 전체 논문 내용을 활용한 통합적 아이디어 생성을 핵심으로 한다.
SciPIP의 아이디어 제안 파이프라인. 검색된 문헌과 LLM의 내부 지식을 이중 경로로 통합
SKC 기반 문헌 검색 및 문헌 클러스터링 파이프라인. 사용자 쿼리에서 키워드를 추출하고 의미론적, 키워드 기반, 공동 발생 기반 검색을 수행
총평: SciPIP는 LLM 기반 과학 아이디어 생성이라는 중요한 문제를 다층적으로 개선한 실용적인 시스템으로, 구조화된 문헌 데이터베이스와 다중 입도 검색, 이중 경로 생성이라는 세 가지 혁신을 통해 기존 방식 대비 눈에 띄는 성능 향상을 달성했다. 특히 공개 데이터베이스 제공과 체계적인 평가는 강점이나, LLM 의존성, 평가의 주관성, 실제 연구 영향 측정 미흡이 한계로 남아있다.