Language models surface the unwritten code of science and society

저자: Honglin Bao, Siyang Wu, Jiwoong Choi, Yingrong Mao, James A. Evans (University of Chicago) | 날짜: 2025 | DOI: arXiv:2505.18942


Essence

Figure 1

자기-강화(self-reinforcement)를 통해 암묵적 규범을 점진적으로 증폭시켜 모델이 명시적으로 표현하도록 유도하는 개념적 틀

대규모 언어모델(LLM)이 내재된 편향을 진단 도구로 활용하여 과학과 사회의 "불문율(unwritten code)" — 암묵적 고정관념, 휴리스틱, 암수정인 규범 — 을 명시적으로 드러내고 비판 대상으로 만들 수 있다는 주장.

Motivation

Achievement

Figure 2

가설 탐색을 통한 선험적 신념에서 사후적 신념으로의 전환 과정

  1. 은폐된 동료심사 기준 발굴: 46개 학술 컨퍼런스의 26,731편 논문 데이터를 분석하여, 심사자들이 명시적으로 언급하지 않으면서도 암묵적으로 보상하는 평가 기준을 식별. 이론적 엄밀성(theoretical rigor)은 LLM의 선험적 신념과 부합하지만(상관계수=0.49), 맥락화와 스토리텔링(contextualization & storytelling)은 심사자들이 명시적으로 피하면서(상관계수=-0.14) 동시에 점수로는 암묵적으로 보상함.
  2. 일관된 편향 패턴 확인: 선험적 신념의 우위에서 사후적 판단으로의 전환이 다양한 모델과 표본 외(out-of-sample) 평가에서 강건하게 나타남. 4라운드 반복 탐색으로 20개 가설이 97%의 사례를 설명.

How

Figure 4

선험적 신념 대비 사후적 신념: 각 가설의 지수는 선험 빈도 변화의 순위를 나타냄

방법론적 특징:

Originality

Limitation & Further Study

후속 연구:

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5

총평: 이 논문은 LLM의 편향을 사회 진단의 도구로 재해석하는 혁신적 관점을 제시하며, 과학 평가의 암묵적 기준을 최초로 규명한 엄밀한 실증 연구다. 다만 인과성 확립, 실제 제도 개선 효과 검증, 그리고 이러한 "불문율" 공개의 윤리적 함의에 대한 더 깊은 성찰이 필요하다.

같이 보면 좋은 논문

기반 연구
인간과 AI의 창의성 비교 연구가 과학 사회의 불문율 탐구를 위한 기초 연구
다른 접근
LLM의 편향 진단을 과학 분야 불문율 발견과 개인 성격 탐지라는 다른 도메인에 적용한 사례
후속 연구
AI 아이디어가 인간 창의성에 미치는 영향을 과학과 사회의 암묵적 규범 차원에서 확장 분석
응용 사례
LLM의 성격 탐지 능력을 과학 사회의 암묵적 편향 발견에 적용한 확장 연구
응용 사례
AI가 과학의 암묵적 코드를 드러내는 현상이 주제 다양성 축소와 상호작용 감소의 원인을 설명한다.
← 목록으로 돌아가기