‘모두를 위한’ AI: 새로운 모델 액세스로 천문학부터 교육까지 학술 연구를 발전
2023년 초, 카이스트(Korea Advanced Institute of Science and Technology)의 앨리스 오(Alice Oh) 교수와 동료 연구진은 교내 학생들 사이에서 오픈AI사의 챗GPT에 대한 치솟는 관심을 인식하고, 이에 대한 연구가 필요하다고 판단했습니다.
프롬프트에 답변하며 대화하는 오픈AI사의 대규모 언어 모델(LLM) 챗GPT가 학생들의 학술 활동에 도움을 주고 교육적으로도 유용하다고 판단했기 때문입니다.
연구진은 학생들을 참여시켜 이 프로젝트를 발전시키고자 했으며 이를 위해 자체 채팅 애플리케이션을 개발하는 방법에 대해서도 고민하기 시작했습니다.
앨리스 오 카이스트 전산학부 교수는 “학기가 시작되는 3월에 학생들이 바로 사용할 수 있도록 서둘러 연구를 진행했습니다”라고 이야기했습니다.
곧 해결책을 찾을 수 있었습니다. 2023년 4월, 마이크로소프트 리서치(Microsoft Research)는 다양한 작업에 사용할 수 있는 다량의 데이터로 학습된 대규모 AI 모델인 기반 모델(Foundation Model)의 개발과 활용을 가속화하는 것을 목표로 하는 이니셔티브를 시작했습니다.
AFMR (Advancing Foundation Models Research)은 애저 AI 서비스(Azure AI Services)를 통해 학계 연구자들에게 최첨단 기반 모델에 대한 액세스를 제공함으로써 글로벌 AI 연구 커뮤니티를 육성하고, 과학적 발견부터 교육, 의료, 다문화 역량 강화, 법률, 디자인 등 다양한 분야의 업무를 견고하고 신뢰성 있는 모델을 통해 지원하는 것을 목표로 합니다.
이 이니셔티브의 보조금 프로그램은 15개국 대학의 200개 프로젝트가 포함되며, 다양한 분야를 아우릅니다. 보스턴 노스이스턴 대학교 연구진은 근로자의 웰빙에 공감하는 것처럼 보이도록 설계된 AI 기반 비서를 연구하고 있고, 베트남 호치민시 공과대학교의 연구진은 베트남 사람들을 위한 대규모 언어 모델을 개발할 계획입니다. 캐나다 몬트리올 대학교 연구진은 대규모 언어 모델이 분자 설계와 신약 개발에 어떻게 활용될 수 있는지 연구하고 있습니다.
학계 연구자들이 대규모 모델을 실행하기 위해 사용하는 공유 리소스는 컴퓨팅 성능이 비교적 떨어져 기반 모델에 접근하는 데 어려움이 있습니다.. 이런 문제를 해결하기 위해 마이크로소프트 리서치는 연구자들이 마이크로소프트 애저(Microsoft Azure)를 통해 제공되는 다양하고 강력한 기반 모델에 액세스하는 것을 지원하며, 산업계뿐만 아니라 학계 커뮤니티에서도 AI 개발을 주도할 수 있는 이 이니셔티브를 개발했습니다.
“AI의 발전을 위해 학계로 진입해야 할 필요성을 체감하고 있습니다”라고 에블린 비에가스 마이크로소프트 리서치 연구 부문 시니어 디렉터(Evelyne Viegas, senior director of Research Catalyst at Microsoft Research)는 말합니다. “이러한 다양한 관점이 우리가 무엇을 하는지에 대한 윤곽을 더 뚜렷히 할 수 있습니다.”
오 교수와 카이스트 팀은 마이크로소프트의 애저 오픈AI 서비스를 활용해 챗GPT 기반 모델을 활용한 챗봇 플랫폼을 개발했습니다. 이 플랫폼은 EFL(English as a Foreign Language) 프로그램에 참여하는 학생들의 영어 에세이 작성을 돕고 있으며, 여기에는 애저에서 제공하는 보안, 개인 정보 보호 및 책임 있는 AI 보호 기능이 활용됩니다. 학생들은 교수나 조교의 지도를 받을 수 없는 밤에도 해당 플랫폼을 통해 에세이를 작성할 수 있으며, 영어에세이를 작성하는 데 어려움을 겪을 때에도 도움을 받고 있습니다.
오 교수의 연구팀은 챗봇이 학생들의 질문에는 답할 수 있지만, 학생들을 대신해 에세이를 작성하지는 않도록 설계했습니다. 한 학기 동안 213명의 학생들이 이 챗봇을 활용해 에세이를 수정했고, 연구팀은 학생들의 질문과 챗봇의 답변, 수정된 에세이 데이터를 수집하고 분석해 연구 논문을 발표했습니다.
연구진은 학생들이 챗봇을 적극적으로 활용하고, 피드백을 적극적으로 수용하는 것을 확인했습니다. 오 교수는 학생들이 챗봇을 ‘지능적인 동료’로 생각하며or여기며, AI 기술이 학교 강의의 학습 효과를 향상시키는 데 긍정적인 영향을 미칠 것이라고 말합니다. 학생들은 오픈 AI의 대규모 언어 모델(LLM)인 GPT-4 모델을 활용해 다국어로 소통할 수 있으며, 영어와 모국어 간 전환이 용이해 자연스러운 대화가 가능합니다.
카이스트 연구팀은 해당 플랫폼을 창의적 글쓰기 수업과 영어 회화 수업에도 적용할 예정입니다. 오 교수는 생성형 AI가 단순히 답변만 제공하는 것이 아니라 추론 능력까지 갖출 수 있도록 학습시킨다면 교육 분야에서 큰 잠재력을 발휘할 것이라 기대합니다.
오 교수는 “대학은 AI 기술을 적극적으로 활용하고, 과학 연구와 교육 분야에 어떻게 적용할 수 있을지 고민해야 합니다”라고 말합니다.
‘슈퍼 어드바이저(Super adviser)’를 둔 것처럼
마이크로소프트 프로그램의 지원을 받는 노스캐롤라이나 농업 기술 주립 대학의 연구진은 교통 체증과 안전 위험 요인을 식별할 수 있는 AI 기반 교통 모니터링 시스템을 개발 중입니다. 이 프로젝트는 기존 모니터링 시스템에서 사람이 직접 수행하던 많은 부분을 자동화하는 것을 목표로 합니다.
연구진은 연방 정부에서 수집한 교통 데이터를 바탕으로, GPT-4와 다른 AI 모델을 활용해 교통 패턴과 혼잡도를 분석했습니다. 이에 따라 사용자는 챗봇을 통해 시스템과 소통하며, 특정 위치의 교통 체증이나 차량 주행 속도 등 현재 교통 상황을 실시간으로 확인할 수 있습니다.
박사 과정 학생인 테워드로스 게브레(Tewodros Gebre)는 “이 시스템은 교통 상황을 더욱 쉽게 파악하고 효율적으로 관리할 수 있게 만들 것”이라고 말합니다.
이 시스템은 GPT-4를 활용해 센서, 드론, GPS 등에서 수집한 교통 데이터를 해석합니다. 따라서 데이터 과학자가 아니더라도 교통 기관, 도시 계획가, 시민들은 채팅 애플리케이션을 통해 교통 상황에 대한 정보를 빠르게 얻을 수 있습니다.
레일라 하쉐미-베니(Leila Hashemi-Beni) 노스캐롤라이나 농업 기술 주립 대학 지리공간 및 원격 감지 학과 부교수는 “우리는 데이터 형평성에 대해 이야기하고 있다”며, “챗봇을 통해 사람들은 복잡한 모델에 직접 액세스하지 않고도 필요한 정보를 얻을 수 있다고 말합니다. 또한 다양한 수준으로 기술을 보유한 사람들도 이 시스템을 통해 정보를 얻을 수 있다고 강조합니다. 또한 현재 개발 중인 이 시스템이 자연재해 발생 후 최적의 대피 경로를 파악하는 데에도 도움을 줄 수 있다고 말합니다.
“단순히 교통수단에 국한된 것이 아닙니다. 이 프로젝트는 훨씬 더 큰 영향력을 가지며, 연구자이자 교육자인 우리에게 도움이 되는 최첨단 연구 기회를 제공합니다”
하버드 대학교와 호주 국립 대학교의 천문학자들은 유니버스 TBD(Universe TBD)라는 그룹을 구성해 GPT-4를 활용한 천문학 연구의 발전을 위해 다방면으로 협력하고 있습니다. 그들은 대규모 언어 모델(LLM)을 이용해 30만 개 이상의 천문학 논문을 분석하고, 이를 바탕으로 천문학 기반의 채팅 애플리케이션을 개발했습니다.
앨리사 굿맨(Alyssa Goodman) 하버드 대학 응용천문학과 로버트 휠러 윌슨 교수는 이 애플리케이션이 궁극적으로 학술 논문에서 중요한 정보를 추출하여 데이터를 분석해 젊은 천문학자들의 연구와 이론을 발전시키는 데 도움을 줄 수 있다고 말합니다.
“좋은 아이디어가 떠오르더라도, 관련 문헌을 검색하고 데이터를 일일이 수집하는 것은 연구자들에게 큰 부담이 될 수 있습니다”라고 굿맨은 말합니다. 이 애플리케이션을 활용하면 “’당신의 의견은 좋은 아이디어일 가능성이 있는데, 그 이유는 다음과 같습니다’ 또는 ‘이것은 별로 좋은 아이디어가 아닐 것 같은데, 그 이유는 다음과 같습니다’라고 조언해줄 수 있는 백과사전적 지식을 갖춘 뛰어난 천문학자이자 훌륭한 조력자를 곁에 두는 것과 같습니다”
산도르 크루크(Sandor Kruk) 유럽우주국 데이터 과학자, 카르테익 아이어(Kartheik Iyer) 컬럼비아 대학 NASA 허블 펠로우(NASA Hubble Fellow), UniverseTBD를 이끄는 이오아나 시우카(Ioana Ciucă) 호주 국립대학교 주빌리 공동 연구원은 “모든 천문학자들이 접근 가능한 천문학용 소형 언어 모델을 개발하고자 한다”고 말합니다.
“우리의 미션은 모두를 위한 과학기술의 민주화를 이루는 것입니다”라고 그녀는 말합니다. “GPT-4는 대규모 언어 모델(LLM)로, 많은 리소스가 필요합니다. 이와 같은 민주적인 액세스를 이루는 노력의 일환으로 우리는 GPT-4에서 학습하고, GPT-4보다 천문학 언어에 더 특화된 소형 모델을 개발하고자 합니다. 이것이 바로 우리가 구상하는 계획입니다.”
AFMR의 여러 연구 프로젝트는 대규모 언어 모델(LLM)이 사회에 제공하는 여러 혜택에 초점을 맞추고 있습니다. 여기에는 생성형 AI를 활용해 팬데믹 위험 평가를 하는 것부터, 시각 및 언어 모델을 사용해 시각 장애가 있거나 저시력을 가진 사람들이 야외에서 길을 찾는 데 도움을 주는 것까지 포함됩니다.
“다양한 관점이 반영될수록 기술의 품질은 향상됩니다.”
옥스퍼드 대학교의 연구진은 대규모 언어 모델(LLM)이 더욱 다양해지도록 정보를 제공하는 인간의 피드백을 확장하는 방법을 연구하고 있습니다. 이를 위해 95개의 학술 논문을 분석한 결과, 대규모 언어 모델(LLM)의 출력물이 소수의 인원으로부터 나온 피드백에 따라 조정 및 평가되어 전체 인구를 대표하지 않는다는 점을 발견했습니다. 이에 대해 연구원 중 한 명인 한나 로즈 커크(Hannah Rose Kirk)는 대규모 언어 모델(LLM)을 사용하는 “엄청나게 작은 하위 집단”의 선호도와 가치를 반영한 답변을 제공할 것이라고 설명했습니다.
예를 들어, 대규모 언어 모델(LLM)에 결혼 준비에 대한 도움을 요청하면, 일반적으로 크고 하얀 드레스, 장미 등 전형적인 서양 결혼식에 대한 정보를 제공할 가능성이 높습니다. (이 결과는 2021년 연구의 일부입니다).
옥스퍼드 대학교에서 대규모 언어 모델(LLM)을 연구하고 있는 박사과정 학생인 커크는 “대규모 언어 모델(LLM)이 개인이나 사회문화적 맥락에 대해 더 많이 학습해 결혼식을 계획하는 데 도움을 주거나, 적어도 사람마다 생각하는 결혼식이 다르다는 것을 인식한다고 상상해보라”며, “이를 위해서는 사용자가 추가 질문을 통해 답변의 방향성을 조절해야 할 수도 있다”고 말합니다.
커크와 옥스퍼드 대학교 부교수이자 옥스퍼드 인터넷 연구소의 선임 연구원인 스콧 헤일(Scott Hale)은 AFMR 프로젝트를 진행했습니다. 이를 위해 75개국 1,500명을 대상으로 대규모 언어 모델(LLM)의 사용 빈도를 조사하고, 그들이 중요하게 생각하는 생성형 AI의 특징을 파악했습니다. 예를 들어, 그들이 가치관을 반영한 답변을 원하는지, 사실적이고 정직한 답변을 원하는지 등을 조사했습니다. 연구 참여자들은 다양한 생성형 AI 모델과 실시간으로 대화를 나눴고, 연구진은 그 결과를 평가했습니다.
커크와 헤일은 애저 기능을 활용해 전 세계 연구 참여자들의 피드백과 대화를 수집하고, 이를 기반으로 대규모 언어 모델(LLM)을 훈련시키고 조정해 다양한 모델을 만들 예정입니다. 이렇게 수집된 데이터 집합을 다른 연구원들에게 제공, 보다 포괄적인 대규모 언어 모델(LLM)이 개발될 수 있도록 지원할 계획도 갖고 있습니다.
헤일은 “사람들은 이 기술이 다른 사람이 아닌 자신을 위해 만들어졌다고 느끼고 싶어 합니다”라고 말합니다. “유용성을 얻는다는 측면에서 이 기술을 대화형 에이전트(Conversational agent)로 사용하여 추론, 결정, 검색, 콘텐츠 액세스 등을 할 수 있다면 그 혜택은 사회 전반에 고르게 분배되어야 합니다”
이어 그는 “생성형 AI 모델을 개발할 때, 다양한 사람들의 의견과 시각이 반영된다면, 모두에게 도움이 되는 더 나은 기술을 만들 수 있습니다”라고 말합니다.
‘전 세계의 변화를 이끄는 촉매제‘
2022년 11월, 비에가스는 오픈AI가 챗GPT를 공개한 이후 마이크로소프트 리서치가 학계 연구자들이 생성형 AI를 어떻게 활용하고 어떤 이점을 얻는지 알고 싶어 했다고 언급했습니다마이크로소프트 리서치는 인간의 목표에 걸맞는 AI, 유익성 및 과학적 발견을 위한 AI 기본 모델을 개발하는데 초점을 둔 연구자 글로벌 네트워크를 구축할 수 있는 가능성을 확인했습니다. 또한, AFMR 프로그램은 바이든 정부가 추진하는, 신뢰할 수 있고 안전한 AI 시스템 구축을 위한 자율 서약(Voluntary commitments)을 지원하기 위해 만들어졌다고 설명합니다.
AFMR 프로그램은 마이크로소프트의 애저 AI 서비스를 활용해 모델과 사용자가 지정할 수 있는 API에 액세스할 수 있도록 지원합니다. 이를 통해 의료와 같은 민감한 분야에서도 연구를 진행할 수 있으며, 애저 빌트인 보안 및 규정 준수 프로토콜을 통해 데이터를 안전하게 보호합니다. 이 이니셔티브는 참가자들이 서로 교류하고 학습할 수 있는 기회를 제공합니다. 참가자들은 컨퍼런스나 가상 이벤트를 통해 마이크로소프트 연구진과 협력할 수 있으며, 다양한 분야의 전문가들과 지식을 공유하고 네트워크를 구축할 수 있는 기회도 얻을 수 있습니다.
비에가스는 “리소스에 액세스하는 것과 다른 사람들의 연구를 참고해 자신의 연구를 발전시키는 것은 서로 다르다”고 말합니다. 이 이니셔티브의 궁극적인 목표는 전 세계의 다양한 연구 커뮤니티를 지원하고, 더 많은 사람들이 AI 기술을 활용하여 사회에 기여할 수 있도록 돕는 것입니다. 그녀는 “AI가 일부 사람들에게만 혜택을 주는 것이 아니라, 모든 사람들이 함께 누릴 수 있는 글로벌 변화의 촉매제가 되기를 희망합니다”라고 강조합니다.
관련 링크:
- 자세히 알아보기: Microsoft의 Accelerating Foundation Models Research 보조금 프로그램
- 자세히 알아보기: The Prism Alignment Project: Participatory, Representative and Individualised feedback for Subjective and Multicultural Alignment
상단 이미지: 카이스트전산학부 교수인 앨리스 오(Alice Oh)는 새로운 마이크로소프트 리서치 이니셔티브를 통해 연구 보조금을 받는 전 세계 15개국 학술 연구원 중 한 명입니다. (사진 : Jean Chung 제공)