저자: Xingyu Su, Xiner Li, Yu-Ching Lin, Ziqian Xie, Degui Zhi | 날짜: 2025 | DOI: 10.48550/arXiv.2507.19523
ATGC-Gen은 트랜스포머 기반 언어 모델을 활용하여 생물학적 특성(세포 타입, 전사인자 결합 등)을 조건으로 하는 제어 가능한 DNA 서열 생성을 수행하는 프레임워크이다. 교차 모달 인코딩을 통해 다양한 생물학적 신호를 통합하여 기능적이고 다양한 DNA 서열을 생성한다.
ATGC-Gen은 다음과 같은 구조로 작동한다:
총평: 본 논문은 DNA 서열 설계라는 중요한 생물학적 문제에 트랜스포머 언어 모델을 체계적으로 적용하고, 교차 모달 조건화를 통해 다양한 생물학적 신호를 통합하는 실용적 프레임워크를 제시한다. 새로운 ChIP-Seq 벤치마크와 일관된 실험 결과는 강점이나, 실제 생물학적 검증과 방법론의 기술적 깊이 측면에서는 개선의 여지가 있다.