- 연구자에게 논문은 연구 데이터의 보고입니다.
- 논문에서 얻을 수 있는 소중한 데이터는 내 연구의 근간이 됩니다.
- 이 데이터를 빠르게 추출하는 GPTs를 만들었습니다.
1. 소재 연구 논문 읽기
데이터 기반 연구가 아니더라도 논문의 데이터는 소중한 자원입니다.
특히 소재 연구에서는 선행 연구에 나온 물성과 특성들이 매우 중요합니다.
소재 연구자들이 하는 일 중 하나는 논문을 읽으며 데이터를 모으고,
이를 바탕으로 본인의 연구를 설계하는 일입니다.
그런데 이 일이 쉽지 않다기보다 시간이 많이 걸립니다.
이런 논문을 읽어서
- 이런 내용으로 정리를 해야 합니다.
- 머리 속이든, 연구노트든 간에요.
- 그런데 글을 읽고 내용을 추출해서 정리하는 일은 LLM이 가장 잘 하는 일입니다.
- GPT에게 시켜봅시다.
2. Materials Data Extractor
- 몇 번의 시행 착오를 거쳐 GPT를 하나 만들었습니다.
- 본문 중 표로 정리된 데이터 외에도 문장으로 쓰여진 데이터를 추출하고,
- 인용된 다른 논문들의 수치도 최대한 끌어옵니다.
- 이 GPT에 Materials Data Extractor라는 이름을 붙였습니다.
- GPT를 실행한 후 논문만 올리고 실행을 누르면 됩니다
- 실행 화면을 녹화하여 올렸습니다. 전체 화면으로 확인해주시기 바랍니다.
- 데이터 누락을 막기 위해 여러 차례 추출과 검수를 반복했으며,
- 데이터를 표로 정리시키고,
- 데이터로부터 인사이트를 3개 가량 도출합니다.
- 그리고 논문의 소재 중 최적 소재를 선정하고 선정 이유를 밝힙니다.
- 마지막으로 .docx 파일로 정리하여 저장합니다.
- 한 편의 논문에 실린 데이터가 다음과 같이 정리됩니다.
- 전문가가 실제로 논문을 읽고 정리한 내용과 거의 차이가 없습니다.
- 정리된 파일은 다운로드하여 자유롭게 사용할 수 있습니다.
- 끝이 아닙니다.
- GPT가 논문 내용을 모두 파악하고 있으므로 모든 질문을 자유롭게 할 수 있고,
- 정리된 내용을 다른 형식, 예를 들어 xlsx나 pptx로 받을 수 있습니다.
- 엑셀 형식으로 정리를 요청할 수도 있으며,
- 그래프로 그려달라고 할 수도 있습니다.
- 각자의 아이디어를 담아 자유롭게 활용해주시면 좋겠습니다.