InternAgent: When Agent Becomes the Scientist–Building Closed-Loop System from Hypothesis to Verification

저자: Shanghai Artificial Intelligence Laboratory (InternAgent Team) | 날짜: 2025 | DOI: 10.48550/arXiv.2505.16938


Essence

Figure 1

InternAgent가 지원하는 12가지 과학 연구 작업: 반응 수율 예측, 분자 동역학, 전력 흐름 추정, 시계열 예측, 전사 예측, 인핸서 활성도 예측, 감정 분류, 2D/3D 이미지 분류, 의미론적 분할, 자율 주행

InternAgent는 대규모 언어 모델(LLM) 기반의 통합 폐루프(closed-loop) 다중 에이전트 프레임워크로, 가설 생성부터 실험 검증까지 과학 연구의 전체 사이클을 자동화하는 자율 과학 연구(Autonomous Scientific Research, ASR) 시스템이다. 이 시스템은 인간 전문가의 피드백을 통합하면서도 12개의 서로 다른 과학 분야(화학, 생물학, 컴퓨터 비전, NLP 등)에서 성능 향상을 달성했다.

Motivation

Achievement

Figure 2

InternAgent의 3가지 핵심 능력: 1) 인간 대화형 피드백이 있는 자체 진화 아이디어 생성, 2) 아이디어-방법론 구성, 3) 진화적 실험 계획 및 실행

  1. 성능 향상 (시간 효율성):
    • 반응 수율 예측(Reaction Yield Prediction): 기저선 27.6% → 35.4% (12시간 내)
    • 인핸서 활성도 예측(Enhancer Activity Prediction): 피어슨 상관계수 0.65 → 0.79 (4시간 내)
    • 2D 의미론적 분할(2D Semantic Segmentation): 정확도 78.8% → 81.0% (30시간 내)
    • 인간 연구자는 유사한 성능 향상에 수개월 소요
  2. 12개 과학 분야의 확장성:
    • AI 작업(이미지 분류, 감정 분류) 및 과학 작업(화학, 생물학, 분자 동역학) 모두 지원
    • 단일 통합 프레임워크로 이질적인 문제 해결
  3. 대규모 코드 베이스 처리:
    • 단순 파일 수정을 넘어 다중 파일로 구성된 프로젝트 레벨의 수정 및 디버깅 수행

How

Figure 3

반응 수율 예측 작업에 대한 InternAgent의 자체 진화 아이디어 경로

2.1 자체 진화 아이디어 생성 모듈 (Self-Evolving Idea Generation)

Survey Agent (조사 에이전트):

Idea Innovation Agent:

Assessment Agent:

Human-Interactive Feedback:

2.2 아이디어-방법론 구성 모듈 (Idea-to-Methodology Construction)

Method Development Agent:

Code Review Agent:

2.3 진화적 실험 계획 및 실행 모듈 (Evolutionary Experimental Planning and Execution)

Coding Agent (Openhands, Aider, AutoDebug 서버 활용):

Orchestration Agent (조율 에이전트):

Multi-round Experiment Loop:


Originality


Limitation & Further Study


Evaluation

총평: InternAgent는 가설 생성부터 검증까지 자동화된 폐루프 과학 연구 시스템을 구현한 의미 있는 작업이며, 12개 분야의 실제 성능 향상으로 실용성을 입증했다. 다만 일부 기술적 세부사항의 명확화와 실제 물리적 실험으로의 확장이 향후 과제이다.

같이 보면 좋은 논문

기반 연구
InternAgent의 다중 에이전트 협력 프레임워크가 유전자 발견을 위한 AI 과학자 팀 구성의 기술적 기반을 제공한다.
기반 연구
인간-AI 지식 공진화 이론이 InternAgent의 폐루프 다중 에이전트 시스템 설계의 철학적 기반을 제공한다.
기반 연구
인간-AI 공진화 파트너십 이론이 InternAgent와 같은 폐루프 다중 에이전트 시스템의 철학적 설계 원리를 제공한다.
기반 연구
InternAgent의 다중 에이전트 협력 프레임워크가 원리 기반 소재 발견의 해석가능한 탐색 시스템 구현에 활용될 수 있다.
다른 접근
둘 다 자기진화형 바이오의학 AI 시스템을 구축하지만 STELLA는 도구 확장성에, InternAgent는 폐루프 연구에 중점을 둔다.
다른 접근
둘 다 완전 자율적 과학 연구를 목표로 하지만 InternAgent는 통합 프레임워크에, AI Scientist-v2는 트리 서치 기반 발견에 중점을 둔다.
다른 접근
둘 다 완전 자율 과학 연구를 목표로 하지만 AI Scientist-v2는 에이전트 트리 서치에, InternAgent는 통합 프레임워크에 집중한다.
후속 연구
인용 추천과 생성을 과학자 에이전트가 수행하는 포괄적 연구 자동화로 확장
응용 사례
InternAgent의 폐루프 과학 연구 프레임워크를 실증 연구 재현성 검증이라는 특정 문제에 적용한 사례로 볼 수 있다.
응용 사례
InternAgent의 폐루프 다중 에이전트 프레임워크가 입자 가속기의 완전 자율 운영 시스템 구현에 적용될 수 있다.
반론/비판
InternAgent는 다중 에이전트의 협력 성능을 강조하는 반면, Vending-Bench는 단일 에이전트의 장기 일관성 한계를 드러낸다.
← 목록으로 돌아가기