저자: Xianrui Zhong, Yufeng Du, Siru Ouyang, Ming Zhong, Tingfeng Luo | 날짜: 2024 | DOI: 10.18653/v1/2024.acl-long.683
화학 반응 절차를 자연언어에서 구조화된 행동 시퀀스로 추출하는 예시
과학 문헌의 비정형 자연언어로 표현된 실험 절차를 Python 코드 생성 문제로 재정의하여 대규모 언어모델(LLM)을 활용해 화학 합성 행동을 추출하는 방법론을 제시한다. 프로그래밍 언어의 구조적 특성(클래스, 상속, 타입)을 활용하여 엔티티 간 관계를 명확히 포착한다.
ActionIE 프레임워크 개요: 패턴 마이닝 → 텍스트 재표현 → 코드 생성 → 자연언어 변환
텍스트 재표현 예시
총평: ActionIE는 프로그래밍 언어의 구조적 특성을 활용하여 과학 문헌의 복잡한 실험 절차를 추출하는 창의적인 접근법을 제시하며, 신규 벤치마크와 평가 메트릭을 통해 실질적 기여를 하였다. 다만 LLM 의존성, 도메인 특화성, 패턴 마이닝의 신뢰도 분석 강화로 더욱 견고한 연구가 될 수 있다.