소재 논문 데이터 추출 및 정리

  • 연구자에게 논문은 연구 데이터의 보고입니다.
  • 논문에서 얻을 수 있는 소중한 데이터는 내 연구의 근간이 됩니다.
  • 이 데이터를 빠르게 추출하는 GPTs를 만들었습니다.

1. 소재 연구 논문 읽기

  • 데이터 기반 연구가 아니더라도 논문의 데이터는 소중한 자원입니다.

  • 특히 소재 연구에서는 선행 연구에 나온 물성과 특성들이 매우 중요합니다.

  • 소재 연구자들이 하는 일 중 하나는 논문을 읽으며 데이터를 모으고,

  • 이를 바탕으로 본인의 연구를 설계하는 일입니다.

  • 그런데 이 일이 쉽지 않다기보다 시간이 많이 걸립니다.

  • 이런 논문을 읽어서


  • 이런 내용으로 정리를 해야 합니다.
  • 머리 속이든, 연구노트든 간에요.


  • 그런데 글을 읽고 내용을 추출해서 정리하는 일은 LLM이 가장 잘 하는 일입니다.
  • GPT에게 시켜봅시다.

2. Materials Data Extractor

GPT: Materials Data Extractor

  • 몇 번의 시행 착오를 거쳐 GPT를 하나 만들었습니다.
  • 본문 중 표로 정리된 데이터 외에도 문장으로 쓰여진 데이터를 추출하고,
  • 인용된 다른 논문들의 수치도 최대한 끌어옵니다.
  • 이 GPT에 Materials Data Extractor라는 이름을 붙였습니다.
  • GPT를 실행한 후 논문만 올리고 실행을 누르면 됩니다
  • 실행 화면을 녹화하여 올렸습니다. 전체 화면으로 확인해주시기 바랍니다.
  • 데이터 누락을 막기 위해 여러 차례 추출과 검수를 반복했으며,
  • 데이터를 표로 정리시키고,
  • 데이터로부터 인사이트를 3개 가량 도출합니다.
  • 그리고 논문의 소재 중 최적 소재를 선정하고 선정 이유를 밝힙니다.
  • 마지막으로 .docx 파일로 정리하여 저장합니다.


  • 한 편의 논문에 실린 데이터가 다음과 같이 정리됩니다.


  • 전문가가 실제로 논문을 읽고 정리한 내용과 거의 차이가 없습니다.
  • 정리된 파일은 다운로드하여 자유롭게 사용할 수 있습니다.
  • 끝이 아닙니다.
  • GPT가 논문 내용을 모두 파악하고 있으므로 모든 질문을 자유롭게 할 수 있고,
  • 정리된 내용을 다른 형식, 예를 들어 xlsx나 pptx로 받을 수 있습니다.
  • 엑셀 형식으로 정리를 요청할 수도 있으며,
  • 그래프로 그려달라고 할 수도 있습니다.


  • 각자의 아이디어를 담아 자유롭게 활용해주시면 좋겠습니다.


도움이 되셨나요? 카페인을 투입하시면 다음 포스팅으로 변환됩니다

Share