이른 아침 눈을 떠보니, 챗GPT 주제로 함께 공부하는 카톡방에 동료 한 분이 조선일보 기사 링크 하나를 첨부해 놓으셨네요…
제목이 눈길을 끌길래 클릭해 보았더니 신문이 아니라 구문이어서 실망스러웠죠.
그럼에도 불구하고 지난번에 본 구문 기사의 내용과 새로 올라온 기사의 인용 이미지에 쓰인 숫자가 달라졌더군요. ‘이왕 베낄려면 제대로 베낄 것이지…’ 입속으로 중얼거리며 ‘좃선일보’ 수준이 그렇겠지 뭐… 비하하는 쓴 웃음을 지었더랬습니다.

그런데 뭔가 찝찝!  도표까지 그려서 낼 정도면 숫자 확인 정도는 했을 성도 싶은데… 하는 생각이 들어서 원래 논문을 찾아서 확인 비교해보기로 작정을 했죠.
졸지에 예정에 없던 ‘논문 찾아 삼만리’ 여정을 순서대로 짚어드립니다. 저의 시행착오를 통해 여러분의 정보 검색 및 가공 활동에 시행착오가 줄어들 수 있다면 오늘 아침 저의 헤매기가 좀 더 가치가 더해질 수 있을 것 같네요.

시작해보죠.

 

1. 기사 내용에 대한 팩트 체크

1-1. 카톡방에서 확인한 조선일보(2023.8.10) 기사 링크와 이미지는 아래와 같았습니다. 

https://www.chosun.com/economy/tech_it/2023/08/10/QKJMC245MBA65IDEPEGP2D56AU/

1-2. 이 내용과 연관된 기사를 2주 전쯤에 AI타임즈와 ZD넷에서 읽은 기억이 나서 구글에게 “챗gpt 성능 저하” 라는 키워드로 검색을 요구했죠.
AI타임즈 쪽에 읽은 흔적이 바로 보이더군요.
(구글 검색 결과 페이지에 나열된 링크 목록 제목이 파란색이 아니라 보라색으로 표시되면 전에 이미 클릭한 적이 있단 뜻입니다.)
챗gpt 성능 저하 구금검색결과화면

1-3. 읽었던 기사를 클릭했죠.
https://www.aitimes.com/news/articleView.html?idxno=152534

1-4. 기사를 보니까 지난 7월 20일자 기사였고, 거기에 인용된 그림이 나타나길래 위의 조선일보 기사의 그림과 비교해 봤죠.
 
챗gpt 성능 저하_ai타임즈_230720

1-5. 아무리 비교해 찾아봐도 조선일보에 그려놓은 그래프 숫자 (소수 인식률이 84%에서 51.1%로 저하된 그림)가 20일전 AI타임즈 기사의 이미지에는 안 보이더군요.
대신 맨 앞(왼쪽 위)의 그림이 소수 숫자(prime numbers) 비교인데… 정작 여기 숫자는 97.6%에서 2.4%로 저하되었다고 표시되어 있지 뭡니까!
어라? 조선일보가 잘못 베낀 건가? AI 타임즈가 애초 잘못 쓴 건가?

이런 경우는 팩트체크 기질상 논문 원본을 찾아서 확인하지 않으면 직성이 풀리질 않습니다. 그래서 곧장 팩트 체크에 돌입했죠!!

2. 해외 영어 논문 원문 서칭하기

저는 대학원을 갈 일이 없어서 논문을 쓸 일도 없었고, 하여 논문 검색의 필요성도 별로 느끼질 못했던 사람입니다. 사실 예전에도 업무상 불가피하게 해외 논문을 검색해보는 경우가 간혹 있긴 했어도 일상적인 업무나 비즈니스 필요에 의해 과학 연구나 의학 연구 논문 따위를 뒤져볼 일이 거의 없었는데요.

최근 들어서 인공지능, 특히 챗gpt가 세상에 나오면서 해당 연구에 기여했던 논문들이 쉴 새 없이 기사에 거론되기 시작하고, 새로운 연구 논문들이 속속 소개되고, 유튜브 영상에서도 아직 출시되지도 않은 인공지능 기술과 서비스들이 속속 연구 논문으로 발표되었다는 소식을 접하면서 비로소 논문 검색의 필요성을 좀 더 확실히 느끼기 시작한 편입니다.

그래서 원문 논문을 어디서 뒤지면 좋을지 몇 차례 시도와 시행착오 끝에 한두 가지 방법을 터득했지요. 여러분도 따라서 알아두시면 도움이 되실 거에요.

2-1. 먼저 기사에 인용된 논문의 게재 출처와 발표자(대학명, 기관, 연구팀), 논문 제목 등을 확인해서 검색어로 뽑아 쓸만한 키워드 소스를 수집해 놓습니다.
만약 논문에서 직접 인용된 그래프나 그림 이미지가 있으면 해당 그림을 다운로드(이 이미지를 다른 이름으로 저장) 받아서 구글 이미지 검색용 소스로 이용해도 됩니다.

굳이 [다운로드]나 [저장]하여 복붙하는 것도 번거롭다면, 가장 베스트한 방법은,
웹사이트에 인용된 그림 위에 마우스를 올리고 오른쪽 버튼을 눌러서 [Google로 이미지 검색]을 곧장 클릭합니다!!

구글이미지검색_크롬클릭

2-2. 해당 이미지와 매칭된 검색 결과 화면이 아래와 같이 뜨면
논문 원문에 대해 가장 충실하게 설명되어 있을 것같은 영문 기사 사이트를 찾아서 클릭합니다.
(보통 가장 인용 클릭 횟수가 높은 순으로 배열을 해주므로, 최대한 왼쪽 맨앞에 있는 기사 링크부터 클릭해보시길 권장합니다.)

구글이미지검색_크롬우클릭_결과

2-3. 이미지 검색 결과 첫번째 링크 기사를 클릭해보니 아래 사이트로 연결되더군요.

https://arstechnica.com/information-technology/2023/07/is-chatgpt-getting-worse-over-time-study-claims-yes-but-others-arent-sure/

2-4. 기사의 제목을 읽어보고 찾는 논문을 다룬 기사가 맞다고 생각되면 기사의 시작 도입 부분을 집중해서 살펴보면서
기사의 출처를 명시하는 대목에 발표 논문의 원문으로 연결되는 하이퍼 링크가 붙어 있는 대목(단어나 구문)이 있는지를 재빨리 찾아 봅니다.
(보통 논문의 ‘제목’이나 이 기사처럼 ‘‘research paper ‘ 와 같은 단어 아래에 파란색 밑줄이 그어져 있거나 본문 글씨와 다른 색깔로 구분되어 표시됩니다.)

구글이미지검색_크롬우클릭_결과1_출처

2-5. 이런 하이퍼 링크가 보일 경우, 클릭하시면 원문 논문이 공개되어 있는 논문 검색 사이트나 해당 pdf 문서로 곧장 연결됩니다.
운좋게 바로 해당 논문으로 연결되면 우측 상단에 있는 [다운로드] 아이콘을 눌러서 pdf 파일을 내려받습니다.
(인쇄 버튼만 있는 경우는 인쇄 아이콘을 눌러서 [pdf로 출력하기] 옵션을 선택하면 파일로 저장됩니다.)

구글이미지검색_원문열림

#챗GPT가 추천하는 논문 검색 추천 사이트 두 군데 :
– 코넬대학교 아카이브(Arxiv) 서비스 : https://arxiv.org/
– 구글 학술검색(Google Scholar) 서비스 : https://scholar.google.com/  

  • 추신 – 사족
    조선일보 기사(2023.8.10)에 인용된 그래프 수치와 AI타임즈 기사(2023.7.20)에 인용된 그래프 수치가 달라진 이유는,
    논문 저자들이 7월 18일에 버전1을 올리고, 이후 8월 1일에 버전2 (다운로드 파일버전은 v1.5)를 올렸는데,
    현재 다운로드 버전에는 그래프 수치가 수정되어 있더군요.  조선일보는 이 그래프를 참조하여 그림을 다시 그린 것으로 짐작됩니다.
    논문검색다운로드_코넬대_아카이브

 

3. 다운받은 논문의 개요 요약 및 내용 추출 방법

 

3-1. 원문 pdf 파일을 다운 받아 개요 요약하기

챗GPT4의 플러그인 기능을 이용해서 해당 원문 사이트의 주소를 제공해주고 개요를 요약해 달라고 하는 게 제일 빠르고 간편합니다.

https://arxiv.org/pdf/2307.09009.pdf

챗GPT4에서 플러그인(유료 플러스 버전) 기능을 쓰려면 어떤 사전 준비와 설정이 필요한지에 대해서는 별도로 올려드린 아래 글의 3번 섹션을 읽어보세요.
https://sonet.kr/3445/

3-2. 학술 연구 논문만 전문적으로 찾아주는 ScholarAI 플러그인을 이용하면 쉽게 개요 요약(자동 번역)을 얻을 수 있습니다.

챗GPT 플러그인_ScholarAI

플러그인을 찾아서 설치(Install) 하고 활성화(체크)한 뒤에 하단 프롬프트 창에다가 논문의 URL 주소를 입력하고
“이 주소의 논문을 읽어줘” 같은 내용으로 명령하면 해당 논문을 분석하여 개요를 요약해서 보여줍니다.
챗GPT 플러그인_ScholarAI_수행결과1

챗GPT랑 나눈 대화는 아래 링크로 공유해놓을 터이니, 어떤 방식의 명령 프롬프트로 더 상세한 분석이나 추출, 요약을 할 수 있는지는 추가로 확인해 보세요.

https://chat.openai.com/share/d5bec2a6-23f1-41b8-9e67-58c1f8e669db


3-3.  AskYourPDF 플러그인을 이용하는 방법

(1) 챗GPT4 플러그인 모드를 선택하고 플러그인 목록 펼침 화면에서 [AskYourPDF] 플러그인을 체크하여 활성화시킵니다.

챗GPT 플러그인_AskYourPDF

(2) 아래와 같이 직접 PDF 파일의 URL주소를 입력해주고 개요 요약을 요청할 수 있습니다.

https://sonet.kr/wp-content/uploads/2023/08/챗GPT-플러그인_AskYourPDF_개요요약.jpg

(3) 아래 전용 업로드 사이트에다 PDF 파일을 직접 업로드해주고 페이지별 상세 분석이나 요약, 번역을 요구할 수도 있습니다.

https://askyourpdf.com/upload

챗GPT 플러그인_AskYourPDF_파일업로드창

(4) 파일 업로드를 마치면 아래 그림과 같이 자동으로 부여된 문서 아이디(doc_id:) 코드가 나타납니다.

챗GPT 플러그인_AskYourPDF_파일아이디복사

(5) 이 아이디를 복사해서 프롬프트 창에 넣어주고 분석이나 요약 등 작업을 시키면 됩니다.

챗GPT 플러그인_AskYourPDF_docid

그렇지만 챗GPT 플러그인 기능은 모두 베타 버전들이라 업데이트가 수시로 일어나고 기능도 챗GPT의 기능 변화와 더불어 성능도 들쭉 날쭉 춤을 추는 경우가 아직도 많습니다.

챗GPT 플러그인_AskYourPDF_수행결과2

나오는 내용이 얼마나 요구한 명령에 정확하게 반응한 데이터인지 꼭 확인 비교 대조해보고, 만족스럽지 않으면 계속해서 다른 플러그인이나, 다른 프롬프트 명령을 통해서 챗GPT의 응답 효율을 높이는 방안을 스스로 적극 찾아나가시길 권합니다.

위 화면 챗GPT와 나눈 대화 실랑이 내역을 샘플삼아 보시려면…
https://chat.openai.com/share/ab29a7cc-6bec-448c-b0a9-7bce0489680a


3-4. 기타 PDF 분석 작업 플러그인들

챗GPT 플러그인 중에 PDF 문서를 읽고 분석, 추출, 요약, 번역 등을 해주는 기능을 가진 플러그인들이 많이 있습니다.
프로버전이 새로 나오기도 하고 더 나은 버전들이 나오기도 하고, 각각 장단점이 있으니 여러 가지를 자주 테스트해보고 자신의 용도에 맞는 것을 찾아서 쓰시는 게 좋습니다.

챗GPT 플러그인_스토어 검색설치

4. 보너스 – 영문 PDF 파일을 통째로 번역하는 방법

위의 챗GPT 플러그인을 활용하면  파일의 내용을 읽어서 자동으로 한글로 요약해주기도 하고 특정한 페이지나 섹션을 선택하여 해당 부분만 부분 번역해주는 등의 일을 시킬 수 있습니다.
그럼에도 불구하고 전체 문서를 번역하여 새 파일을 만들어주는 등의 일을 하기는 어렵습니다. 특히 학술 논문은 대부분 문서 안에 각종 도식이나 표, 그래프 등이 들어있는 경우가 많은데, 챗GPT는 텍스트를 추출해서 문서를 이해하고 요약하는 데 능하지 전체 이미지까지를 통합 처리하는 기능은 아직 없다시피 합니다.

그래서 그래프와 연관된 질문이나 명령을 내리면 거의 제대로 수행하지 못하는 경우가 많습니다.
이런 경우 안되는 기능을 가지고 실랑이를 하면서 시간을 낭비하느니, 전체 문서를 몽땅 한꺼번에 한글로 번역해서 보는 게 현명한 방법일 수 있습니다.

영문 PDF 문서를 번역하는 방법은 크게 두 가지가 있는데 저는 아래 4-1번 방법을 강추합니다.

4-1. PDF문서 번역 전문 사이트를 활용하기

아래 사이트 (온라인독트랜스레이터.닷컴) 을 이용하시면 가장 고퀄리티의 문서 번역이 무료로 가능합니다.
(만족스러운면 1만원 후원을 요청하는데, 안 해도 뭐라고 안 합니다. 원하는 금액으로 다운시켜서 감사 표시를 할 수도 있고요.)
https://www.onlinedoctranslator.com/ko/

(1) 위의 링크를 클릭하여 아래와 같은 사이트가 열리면 맨 앞 상단 쪽의 [번역하기] 링크를 클릭합니다.

PDF파일번역_사이트

아래와 같이 파일 끌어오기 팝업창이 뜨면 탐색기에서 선택한 파일을 드래그해서 끌어 넣든지, 혹은 [파일 업로드] 버튼을 클릭하여 탐색기 창이 열리면 업로드할 파일을 찾아서 선택하고 [열기] 버튼을 눌러 업로드해줍니다.

PDF파일번역_파일업로드

(2) 업로드를 마치면 화면 아래쪽으로 스크롤해보세요.
아래 그림과 같이 [영어] 에서 [한국어]로 자동 검출된 언어 선택이 자동으로 이루어지고 [번역하기] 버튼이 보이면 클릭하세요!

PDF파일번역_파일업로드후_번역하기

(3) 잠시 후 화면 상단 쪽에 [감사합니다] 인사와 함께 [몇 단어 중에서 몇 단어를 번역합니다] 라는 안내문과 함께 [문서 번역 중… OO%] 라고 진행 상황이 표시됩니다.

PDF파일번역_파일업로드후_문서번역중

(4) 번역이 완료되면 화면 하단 쪽으로 아래와 같이 [다운로드] 받을 수 있는 안내창(기부 요청 및 안내 화면)으로 화면이 이동합니다.

PDF파일번역_파일업로드후_번역다운로드

(5) [번역된 문서를 다운로드 받으세요] 링크를 클릭하여 다운로드 창이 뜨면 다운받을 탐색기 폴더를 선택해주고 클릭하면 됩니다.

원본 업로드 파일 이름 뒤에 _ko 라는 접미사를 추가로 붙인 번역본 파일이 원래 업로드한 영문 파일이 있었던 같은 폴더에 새로 생성(다운로드)됩니다.

서비스 진행 화면에서 각종 광고를 노출(게재)하여 수익원으로 삼고 있는 사이트여서 무료로 서비스가 제공되는데, 작업이 만족스러운 분들은 후원금을 보내줄 것을 안내합니다.
멋진 결과물이 나왔으면 종종 만족한 만큼 도네이션을 하시는 것도 바람직한 인터넷 세상을 만들어가는 작은 지혜입니다.

번역본 파일을 열어보시면 원본 파일과 비교했을 때 페이지 이월도 없고, 이미지나 그래프(컬러)까지 그대로 보존한 채로 번역 파일을 만들어준다는 점이 탁월합니다.

PDF파일번역_파일업로드후_문서번역결과비교

단 무료 서비스이다보니, 파일의 크기가 10M를 넘으면 업로드할 수 없습니다.
이런 경우는 부득이 파일의 사이즈를 여러 개로 나누어 개별 파일의 용량이 10M 미만이 되도록 쪼개서 작업한 뒤에 다시 합쳐야 합니다.

(6) 굳이 이렇게라도 작업을 해야 하는 경우에는 서비스 상단 글로벌 메뉴 끝 부분에 있는 [PDF나누기] 기능을 무료로 이용하실 수 있습니다.

PDF파일번역_PDF나누기


4-2. 구글 드라이브의 문서(Doc) 기능을 이용하여 번역하는 방법

위의 번역은 그림이나 표, 그래프 등이 들어 있는 문서도 레이아웃을 깨뜨리지 않고 똑같은 페이지 단위로 번역할 수 있다는 게 장점인 반면,
만약 PDF파일의 텍스트만 정확히 추출해서 내용을 빨리 파악하고, 추출한 내용에 더하여 [재편집]이나 [재가공] 작업을 하고 싶은 경우라면,
구글이 무료(개인들에게) 제공하는 [구글 드라이브]의 문서로 변환한 뒤, 한글로 번역하여 바로 doc  문서로 편집하는 방법도 있습니다.
(이 경우 원본과 다르게 페이지가 바뀔 수 있고, 이미지나 그래프가 깨지거나 위치가 변동 될 수 있다는 단점은 감수하셔야 합니다.  )

방법은 알면 단순합니다.

(1) 구글 드라이브를 구동하고 [새로 만들기] 를 눌러서 [업로드 파일]을 클릭해서 다운받은 PDF 파일을 먼저 업로드해 줍니다,

구글드라이브_구동_파일업로드

(2) 최근 문서함에 들어가 업로드 완료된 파일을 찾아 오르쪽 마우스를 클릭, [연결 앱] 탭을 선택하고 [Google 문서]를 클릭하면 PDF 문서를 자동으로 구글 Doc 형식으로 변환해서 불러옵니다.

구글드라이브_구글문서연결앱선택

(3) Google Doc형식으로 변환된 파일을 열어서 [도구] 메뉴의   [문서 번역] 탭을 찾아 클릭해보세요.

구글드라이브_구글문서번역

(4) [언어 선택] 옵션을 펼쳐서 오른쪽 바를 맨 아래로 스크롤해서 [한국어]를 선택해주면 [문서 번역] 팝업창의 오른쪽 맨 하단에 [번역] 버튼이 파랗게 활성화됩니다.
곧장 [번역] 버튼을 클릭하시면 끝!!

구글드라이브_구글문서번역_언어선택

(5) 아래 예시 화면과 같이 짠! 하면서 영문 PDF 파일이 한글 Doc 문서로 번역된 채로 화면에 나타납니다. 읽으시면 됩니다!

구글드라이브_구글문서번역_한글번역결과

여기서 위의 번역 서비스를 사용할 떄와 다른 단점은 문서의 형식 자체가 바뀌면서 문서의 페이지 수가 원래의 PDF 파일보다 늘어날 수 있다는 점, 그리고 그림이나 도표 등에 숫자나 문자만 번역되고 그래프 형태나 컬러 등이 따로 표시되지 않는다는 점을 유의하셔야 합니다.

번역 방법에 따라서 문서 포맽 등이 달라질 수 있다는 점을 고려하여 자신의 목적과 필요에 맞추어 더 적절한 방법을 선택해서 쓰시는 센스를 발휘하시면 좋겠네요.

5. 글을 맺으며…

태풍이 지난 자리에 유난히도 무덥던 날씨가 한결 시원해지면서 가을 기운을 느끼게 하는 아침입니다..

지금도 이미 챗GPT의 코드 인터프리터가 나오면서 코파일럿 기능에 대한 기대감을 높이고 있는데, 앞으로 이런 번역이라든가 문서 형식에 대한 자유로운 변환 또는 생성 기능은 눈부시게 발전할 것으로 예상됩니다. 더 쉽고 편한 세상, 함수를 모르고 랭귀지를 몰라도 프로그램을 짤 수 있고 입으로 앱을 실행시킬 수 있는 꿈같은 일들이 목전에서 속속 벌어지고 있습니다.

어차피… 언제 배워도 배우지 않으면, 생존 경쟁에서 뒤질 수밖에 없습니다.
더 늦기 전에, 지금 바로 인공지능과 생성 도구들을 공부하세요… ^^