국가생명연구자원정보센터(KOBIC)

KOBICian’s Story

[42호] 쉼 없이 달려온 일 년을 돌아보며

작성자 정해영 (KOBIC 센터장/책임연구원)
작성일2024-12-30 08:23:26
조회수476

KOBIC에서 일하면서 달리기에 입문하게 되었습니다. 특별한 계기가 있었던 것은 아닙니다. 매년 종합건강검진을 위해 문진표를 작성하면서 평소에 숨이 약간(또는 많이) 차게 만드는 운동 및 근력운동을 하느냐는 질문에 항상 ‘아니오’라는 민망한 답을 써 오다가, 이대로는 안 되겠다 싶어서 지난 8월 5일부터 갑자기 달리기를 시작하게 되었습니다. 별다른 시설이나 장비가 필요하지 않고, 혼자서 할 수 있다는 것도 가장 중요한 이유가 되었습니다.

퇴근 후 주 3~4차례 달리기를 위해 집을 나설 때마다 오늘은 또 얼마나 힘이 들지 늘 걱정이 됩니다. 워밍업은 매번 충분하지 않아서 출발 직후에는 몸이 무겁고 관절도 부드럽게 돌지 않습니다. 그러나 인적 드문 한밤의 갑천변 산책로를 무념무상으로 뛰다 보면 점점 몸이 더워지고, 어느덧 대략 3 km 지점의 반환점을 돌아 출발점으로 되돌아오면서 동네 입구의 아파트 불빛이 보이기 시작합니다. ‘얼마 남지 않았구나!’ 마치 재부팅 뒤 컴퓨터가 깨끗해지듯, 오늘 하루 머릿속을 어지럽히던 온갖 스트레스와 잡념은 싹 지워집니다. 겨울밤의 추위는 별다른 방해가 되지 못합니다. 오히려 덥고 땀이 난다고 하여 함부로 웃옷 지퍼를 내리고 몸을 차갑게 하면, 저처럼 체온 관리에 실패하여 심한 감기에 걸려 연말까지의 달리기 계획을 모두 접어야 할 수 있습니다. 달리기의 유익함을 틈나는 대로 주변에 설파하다가 감기에 자주 걸려 체면을 많이 구겼습니다. 역시 ‘런린이’(러닝 + 어린이, 달리기 초보자)의 입방정이 문제였던 것이겠지요.

멀게만 느껴지던 일 년의 끝이 손에 잡힐 듯 겨우 하루 앞으로 다가왔습니다. 과연 잘 해낼 수 있을지 걱정하면서 신발끈을 고쳐 매듯 마음을 다잡고 KOBIC에서의 업무를 시작하였는데, 어느덧 꽤 많은 거리를 달려왔고 이제는 주변의 풍경도 여유롭게 감상할 수준이 된 것 같습니다.

생각보다 정말 많은 일을 경험하였습니다. 불과 얼마 전까지만 해도 개인 차원의 걱정 말고는 특별히 신경을 쓸 일이 없었지만, 이제는 쏟아지는 사안의 중대성을 재빠르게 판단하여 처리 우선순위를 결정하고 무거운 마음으로 결재 버튼을 눌러야 하는 상황이 되었습니다. 판단을 내리기에 앞서 충분한 정보를 수집하였는지, 과연 합당한 근거를 바탕으로 올바르게 판단하였는지, 지금 내리는 결정이 조직의 책무에 부합하는지, 미래를 위한 대비는 올바르게 하고 있는지, 센터장이라는 페르소나에 충실하기 위해 감정을 더욱 절제하고 드러나지 않게 해야 하는지, 조직의 생존을 위해 외부에 대해 지금보다는 더욱 싸움닭 같은 태도를 보여야 하는 것은 아니었는지... 지금도 제 머릿속에는 끊임없이 물음표가 맴돌고 있습니다.

다행스럽게도 이러한 짐을 저 혼자만 질 필요는 없었습니다. 너무나 헌신적으로 일하는 KOBICian 여러분들이 있었기에 큰 과오 없이 지난 일 년을 보낼 수 있었다고 생각합니다. 흔히 과학자라고 하면 연구실에 틀어박혀 지식의 탐구에 몰두하는 사람의 모습을 떠올리게 됩니다. 그러나 KOBIC은 바이오 소재 정보와 데이터의 교환소, 즉 ‘장터’와 같은 곳으로서 저마다 목소리를 내는 이해당사자들의 의견을 듣고 서로가 만족하면서 가치 교환을 이룰 수 있는 터전을 제공하는 곳입니다. 따라서 창고는 튼튼해야 하고, 재고 목록은 늘 제대로 업데이트되어 있어야 하며, 비가 새거나 차고 더운 바람이 들어오면 곤란하고, 때로는 차 한잔을 놓고 이야기를 나누면서 쉬어 갈 수도 있어야 합니다. 제가 느낀 KOBICian은 연구자 또는 엔지니어로서 개인적으로 성취하고 싶은 일은 잠시 내려놓고 일절 사심 없이 저희가 제공하는 서비스를 이용하려는 고객들에게 최선을 다하는 사람들이었습니다.

여기에서 느끼는 가장 소중하고 행복한 일상은 매주 KOBICian’s Story 원고를 매만질 때입니다. 게시할 새로운 글을 자발적으로 투고하는 것은 업무에 바쁜 KOBICian들께는 결코 쉬운 일은 아니었을 것입니다. 이 글을 통해서 각자 KOBIC 내에서 어떤 소중한 일을 하고 있는지 이해를 높이는 계기가 되었다고 생각합니다. 부처에서도 이 글을 통해 유용한 정보를 접하게 되었다고 알려 왔을 때에는 정말 많은 보람을 느꼈습니다.

간혹 다른 글에 비하여 조회수가 월등하게 높은 글이 있습니다. 저도 그런 글이 흥행에 성공한 이유가 무엇일지 나름대로 분석을 해 보게 됩니다. 워낙 좋은 내용으로 글을 썼고, 또한 제목을 아주 효과적으로 잘 뽑았기에 외부에서 검색을 타고 유입되는 방문자가 많아서 그랬을 수도 있고, 혹은 글을 쓴 사람 자체가 KOBIC 내부에서 호기심을 유발하는 대상이기 때문에 ‘엇, 안 그래도 평소에 무슨 일을 하는지 궁금했었는데 도대체 무슨 글을 올렸을까?’하는 기대감으로 조회수가 올라갔을 수도 있습니다. 어느쪽이 사실이든, KOBICian 개인이 갖고 있는 원석과 같은 가치를 더욱 많은 사람에게 노출하게 되었다면 그것으로 충분히 의미 있는 일이 되었으리라 생각합니다.

2025년의 KOBICian’s Story는 3월에 다시 여러분을 찾아뵙도록 하겠습니다. 한 해 동안 정말 수고 많으셨습니다. KOBICian 여러분! 새해 복 많이 받으십시오.

KOBICian’s story는 KOBIC 멤버가 직접 작성하는 현장감 넘치는 글로서 KOBIC의 업무 방향이나 공식 입장과는 다를 수 있습니다.

다른 KOBICian’s Story 보기

시퀀싱 기술의 양질전화(量質轉化)를 담아낼 K-BDS 등록양식 고도화

KOBIC에 입사한 지 어느덧 4개월여의 시간이 흘렀습니다. 짧다면 짧고, 또 길다면 길게 느껴지는 시간이었습니다. 이번 글에서는 최근까지 '등록 양식 고도화 작업'을 수행했던, 단일세포와 공간전사체 데이터에 관한 이야기를 나누고자 합니다.

흔히 조직 수준의 평균적인 유전자 발현을 확인하는 bulk RNA-seq을 과일 셰이크에, 조직을 이루는 개별 세포 단위로 쪼개어 유전자 발현을 측정하는 단일세포 전사체 데이터를 개별 과일에 비교하곤 합니다. 그렇다면, 발현량에 세포나 조직의 위치 정보를 더해 조직 구조와 세포 상호작용을 이해할 수 있는 공간 전사체 데이터는 개별 식재료들을 정교하게 배치한 정찬이라고 볼 수 있을 것입니다. High-throughput sequencing(HTS) 기술은 어떻게 이러한 샘플의 복잡성을 반영하는 방향으로 발전할 수 있었을까요?

제가 처음 대학원 문을 두드리던 무렵에는 RNA-seq이 Microarray를 대체하고 주류 전사체 데이터 생산 기술로 자리매김하고 있었습니다. 이 데이터들에 익숙해질 무렵 단일세포 시퀀싱 기술로 생성된 전사체 데이터를 처음 접하고, 충격을 받았습니다. 여러 연구자가 경쟁하며 개별 연구에서 다루는 세포 수가 순식간에 백만 단위 규모로 폭발적으로 증가했죠. 그러나 시간이 지나며 세포 수라는 양적 가치에서 복합적인 정보들을 통합하는 질적 가치로 연구의 무게중심이 옮겨가는 흐름이 뚜렷해졌습니다. 여전히 많은 세포를 분석하는 연구는 계속되고 있지만, 이제는 여러 오믹스 기술과 공간 정보를 통합하여 개별 샘플로부터 더 풍부한 정보를 얻고, 이를 바탕으로 더 복잡한 생물학적 질문에 답하는 방향으로 연구가 진화하고 있습니다.

이러한 변화를 지켜보며 자연스레 떠오른 개념이 '양질전화(量質轉化)'입니다. 양적 변화가 점진적으로 축적되다 보면 어느 순간 질적 변화가 일어난다는 철학적 개념인데, HTS 기술 발전에 따라 단일세포와 공간전사체 기술의 등장을 지켜보며 이러한 개념을 엿볼 수 있었습니다.

HTS 기술이 성숙함에 따라 단순히 '더 많은 양'의 데이터를 생산한 것이 아닙니다. 단일 실험에서 수십억 개의 시퀀싱 read를 생산할 수 있게 되었고, 이는 단순한 양적 증가를 넘어 질적 변화를 가능하게 했습니다. 데이터 처리량의 규모가 특정 임계점을 넘어서자, 이전에는 불가능했던 패턴 인식과 통찰이 가능해진 것입니다. 세포 단위 정보를 식별하여 고해상도 데이터를 생산하거나, 공간 정보를 추가하여 기존의 유전자 발현 데이터에 새로운 맥락을 더하는 기술적 발전은 모두 시퀀싱 기술의 발전을 통해 점진적으로 증가한 생산량이 어느 수준에 도달하여 나타난 결과일 것입니다.

이렇게 생산된 단일세포와 공간전사체 데이터는 기존의 시퀀싱 데이터와는 상이한 특성들을 지닙니다. 세포 분리 방법, 세포 포집 효율, 이미징 정보 획득을 위한 조직 처리 과정 등 생산과정이 훨씬 복잡할 뿐만 아니라, 생성되는 데이터 자체도 세포 유형별 정보, 세포 간 상호작용, 공간적 분포 등 다층적인 정보를 포함합니다. 그동안 단일세포와 공간전사체 데이터가 국가 바이오 데이터 스테이션(K-BDS)에 등록되지 않은 것은 아니지만, 기존 양식으로는 데이터와 생산과정의 다양한 특성을 충분히 담아내지 못했기에 등록양식 고도화 작업이 필요했습니다.

고도화를 통해 담아내고자 했던 것은 먼저 다양한 데이터의 형태였습니다. 과거에는 몇 가지 표준화된 형식으로 데이터를 관리할 수 있었지만, 이제는 다양한 플랫폼과 기술에서 생성된 데이터의 이질성이 더욱 커졌습니다. 다양한 단일세포 및 공간전사체 기술들은 기존의 KRA뿐 아니라 서로 간에도 다른 형식과 해상도의 데이터를 생성하지만, '단일세포' 또는 '공간전사체'라는 범주 내에서 이들 데이터의 등록이 간편하게 이루어질 수 있도록 했습니다.

또한 메타데이터에 작성해야 할 항목들이 크게 늘어났습니다. 새로운 플랫폼과 기술에 따라 데이터를 해석하고 재현하기 위해서는 더 많은 실험 조건과 기술적 세부 사항이 기록되어야 합니다. 예를 들어, 단일세포 실험에서는 세포 분리 방법, 캡처 효율, 시퀀싱 깊이 등이, 공간전사체 실험에서는 조직 처리 방법, 섹션 두께 등 이미징 정보뿐 아니라 시퀀싱 정보와 산출된 이미지 정보를 연결하는 프로토콜 또한 중요한 메타데이터가 됩니다.

특히 이번 등록 양식 고도화에서는 발현량 매트릭스뿐 아니라 사용자가 제출하는 분석 데이터의 주요 유형을 정의하고 이들이 유래한 샘플 정보와의 연계성을 검증하여 사용자들의 편의를 도모하고자 했습니다. 이는 현재 NCBI GEO나 EBI의 Biostudies를 비롯한 주요 데이터베이스에서도 제공하지 않는 기능이라, 활용성 증대를 통해 K-BDS의 경쟁력을 강화하는 데 도움이 될 것으로 기대합니다.

시퀀싱 기술을 비롯한 바이오 데이터 생산 기술은 앞으로도 계속 발전할 것이며, 새로운 형태의 데이터들이 지속적으로 등장할 것입니다. K-BDS에서도 이러한 기술적 발전을 적시에 파악하고 반영하고자 노력하지만, 등록 양식의 고도화는 기술의 발전 속도를 따라가기 어려운 것이 현실입니다. 그럼에도 불구하고 이러한 노력은 필수적입니다. 새로운 기술로 생산된 데이터는 그에 맞는 메타데이터 없이 제대로 사용하기 어렵고, 충분한 부가 정보 없이 등록된 데이터는 추후 활용 가치가 크게 떨어지기 때문입니다. 그렇기 때문에 이번에 고도화될 단일세포와 공간전사체 데이터 등록양식이 오래도록 유용함을 잃지 않고 연구자들의 데이터 등록에 사용될 수 있기를 바랍니다.

작성자백부경
작성일2025-03-31
조회수155

[제46호] 달러 패권의 주요 사건과 시사점(3) - 중국몽은 유효한가?

지난 2개의 글을 통해 미국 달러화가 어떻게 전 세계에 널리 퍼지게 되었고 일본 경제와 엔화가 어떤 과정으로 달러 패권에 백기를 들게 됐는지 말씀드렸습니다. 마지막으로 위안화 이야기를 해보겠습니다. 2기 트럼프 행정부 출범이후 미국은 무역적자를 빌미로 전 세계에 관세 폭탄을 투하하고 있습니다. 그 표적의 중심에는 역시 중국이 있습니다.

<이미지 출처: 조선일보(https://www.chosun.com/economy/economy_general/2025/02/20/2YJIMYY4ZJCOHBL7LPMVBKRJXQ/)>

위 이미지는 뉴스기사에서 발췌한 2024년도 대미 무역흑자 국가 순위입니다. 역사는 반복됩니다. 미국은 중국에게 ‘제2의 플라자 합의’를 요구할 수 있을지, 그리고 어떤 방향으로 판을 짜 갈지 궁금해집니다.

1편에서 네트워크 외부성 개념을 설명하면서 화폐가 국제적으로 통용되기 위한 몇몇 조건을 설명 드렸습니다. 중국몽(China Dream)을 아시나요? 이는 2012년 시진핑이 중국 최고 리더로 부임하면서 내세운 정치지도 개념입니다. 그 중심에는 ‘위안화의 국제화’가 있습니다. 하지만 중국은 일본의 사례와 1990년 중후반 아시아의 여러 나라들이 겪었던 외환위기 및 그 결과를 철저히 학습했습니다. 중국이 금융시장을 개방하지 않고 ‘관리변동환율제’를 고집하는 이유이지 않을까 싶습니다. 위안화의 국제화를 원하면서 금융시장은 개방하지 않는다니, 생각해 보면 조금은 모순적입니다.. 그렇다면 중국의 속셈은 무엇이었을까요.

먼저 일대일로(一帶一路) 프로젝트입니다. 이는 중국의 신(新)실크로드 전략으로 내륙과 해상의 경제벨트 구축을 의미합니다. 신중국 설립 100주년이 되는 2049년까지 현대판 실크로드를 재구축해 중국과 주변 국가의 경제·무역협력을 확대한다는 목적을 가지고 있습니다.

<이미지 출처: Economist(https://www.economist.com/special-report/2020/02/06/china-wants-to-put-itself-back-at-the-centre-of-the-world)>

쉽게 말해 내륙길(철도)과 해상길(항구)를 건설하는 대규모 인프라 사업을 벌이되 핵심은 이를 위안화로 지원한다는 것입니다. 그 구체적인 방안은 위안화 채권 발행과 통화 스왑(swap)의 두 가지입니다. 채권은 향후 중국에게 갚아야 하는 빚이 되는 것이고, 통화 스왑은 해당 국가의 통화와 위안화를 약정된 환율로 맞교환 하는 방식입니다. 금융시장 개방 없이 위안화를 중국 밖으로 내 보내는 방법이 이해가 되시나요? 제2차 세계대전 이후 유럽 재건을 목적으로 하늘에서 달러를 뿌렸던 것과 유사한 방식입니다.

두 번째로는 페트로 위안화입니다. 중국은 미국이 장악하고 있는 석유 에너지 시스템을 벗어나고자 하는 동시에 위안화로 원유수입대금을 결제하기 위해 엄청난 노력을 기울이고 있습니다. 태양광, 풍력 등 석유대체 에너지원에 대한 기술개발 및 생산시설 투자를 늘리고 있으며 동시에 사우디아라비아, 러시아와 지속적으로 원유와 가스의 위안화 결제를 협의하고 있습니다. 사우디는 빈 살만, 러시아는 푸틴이라는 ‘스트롱맨’이 집권하고 있으니 가능성이 없는 이야기는 아닌 듯합니다. 최근 미국이 러시아-우크라이나 전쟁 종결에서 취하고 있는 입장은 이러한 맥락에서 이해한다면 납득이 갈 수도 있습니다.

달러 패권에 대한 위안화의 도전은 위기는 있었지만 아직 끝나지 않았습니다. 직접적인 통화 전략이 아닌 과학기술(예, DeepSeek, KOBICian 45호), 외교 분야에서 지속적으로 방안을 찾고 있는 중입니다. 판을 흔들고 미국에 협상 카드로 쓸 수 있는 무언가가 나올 때 까지 계속되겠죠. 3개의 짧은 글을 통해 달러 패권과 일본 엔화, 중국 위안화의 도전에 대해서 알아보았습니다. 화폐로 주제를 정한 이유는 네트워크 외부성이라는 개념이 생명연구자원(데이터, 소재)에도 적용 될 수 있다는 아이디어 때문이었습니다. 그렇다면 앞으로 어떤 전략을 취해야 우리나라 생명연구자원이 글로벌 연구자들의 선택을 받을 수 있을까요? 우리가 내어주어야 할 것과 취할 수 있는 것이 무엇인지 깊이 있게 고민해야합니다. 다음 글에서는 이러한 고민들을 국가 정책으로 구체화하는 이야기를 해보고자 합니다. KOBIC은 현재 ‘제4차 국가생명연구자원 관리·활용 기본계획’ 기획연구를 수행 중에 있습니다. 더 재밌는 이야기로 돌아오겠습니다.

작성자박강민
작성일2025-03-21
조회수138

[45호] 중국발 '값싼' 인공지능 DeepSeek의 등장이 갖는 의미

2024년 12월 중국에서 개발되어 발표된 DeepSeek-V3, 그리고 뒤이어 올해 1월에 발표된 증류모델 DeepSeek-R1는 딥러닝 기반의 인공지능 분야에 큰 충격을 주고 있습니다. 이전 서비스들에 비해서 너무나 싼 개발·구축 비용, 그리고 MIT 라이센스, 즉 오픈소스라서 사용자가 직접 설치하여 활용할 수 있기 때문입니다. 그럼에도 불구하고 그 성능은 GPT 서비스 등과 유사하다고 하니 놀라운 따름입니다.

DeepSeek는 헤지펀드 회사의 CEO이면서, 동시에 인공지능 연구회사(회사이름도 DeepSeek)의 창립자인 량원펑이 만들었습니다. DeepSeek-V3와 함께 발표된 기술 문서에 따르면 GPT-4o등 기존 LLM 모델에 비해서 벤치마킹 성능이 전혀 부족하지 않으면서도 모델 학습을 위해 사용한 비용은 557만 달러에 불과했다고 합니다(실제 인프라 구축 비용은 아니며, 모델 학습 시간동안 GPU를 빌린다고 가정할 때 드는 비용-실제 모델학습에 사용된 H800 GPU는 2,048개 이며, GPU 1개를 사용한다고 가정할 때 총 278만 8천 시간이 소요되었고, H800 GPU 1개당 1시간 빌릴 때 비용 2달러로 계산). 통상적으로 수천억 원 이상의 비용을 들여 엄청난 연산 자원을 구축해야만 고성능의 AI 서비스를 개발할 수 있다고 믿었던 고정관념을 깨뜨리는 계기가 되었습니다.

<DeepSeek-V3와 유사 모델의 성능비교, https://github.com/deepseek-ai/DeepSeek-V3>

그렇다면 DeepSeek는 어떤 방법으로 비용을 획기적으로 줄이면서 비슷한 성능을 낼 수 있었을까요? 결론부터 말씀드리면 인공지능 분야에서 수십 년 이상 연구 되어온 다양한 기법의 총망라로 가능하였으며, 엄밀하게 말해서 그 성능도 GPT-4o와 거의 동일하지만 추론 능력이 더욱 뛰어난 GPT-o1보다는 부족한 부분이 있는 것 같습니다.

LLM 모델이나 딥러닝의 상세 설계를 하는 연구자가 아니라면, 사실 어떻게 DeepSeek가 비용을 줄이는지 별로 궁금하게 여기지 않을 것 같으니 이 글에서는 간단하게 다음의 표로 대신하겠습니다.

<DeepSeek의 저비용 고성능 개발 방법>

방법	설명
부동소수점 8비트(FP8) 연산사용	전통적인 LLM 모델에서 가중치 계산을 위해 사용하는 부동소수점 32비트 혹은 16비트 연산 대신 8비트 연산을 사용하여 낮은 가격의 H800을 사용하더라도 가중치 연산 성능은 비슷함 (8비트에 대한 연산 성능은 H100과 H800이 동일)
CoT (Chain of Thought)/추론	곧바로 답을 찾는 것이 아니라 답을 찾기 위해서 여러 과정으로 나누어서 단계별로 접근하면 성능이 향상됨
MoE(Mixture of Experts)	큰 규모의 범용 모델을 만들기보다는 여러 개의 전문가 그룹으로 나누어서 결과를 취합하면 적은 비용으로 비슷한 성능 구현이 가능함
강화학습, Agent/SFT (Supervised Fine Tuning)	모델 학습 진행과 수정을 관리 감독하는 agent가 인간 피드백이나 평가지표의 측정을 통해서 모델을 조금씩 인위적으로 수정하면서 최적화하여 성능향상
증류(Distillation)	노드수와 파라미터 수가 많은 딥러닝 모델을 통해 미리 학습한 후 핵심 네트워크만 추려서 노드수와 파라미터 수를 줄임으로써 일정 수준의 성능은 보장하면서 딥러닝 모델을 실행할 수 있는 인프라 환경을 축소하는 기술
동시 연산-정보교환	통상적인 CUDA기반 모델은 데이터 이동시간은 GPU가 아무 일도 하지 못하지만 알고리즘 변형을 통해 정보교환과 연산이 동시에 가능하게 수정
CUDA/Assembly 레벨 최적화	CUDA 코딩의 최적화 및 Assembly언어 레벨의 코딩을 통해 성능 최적화
최적 모델 성과평가 개발	GRPO(Group Relative Policy Optimization)의 개발을 통해서 모델 학습 시 성과를 잘 평가하고 반영

위 방법 중에서 CoT(Chain of Thought)/추론과 관련하여 2022년에 발표된 흥미로운 연구 결과가 있습니다(“Large Language Models are Zero-Shot Reasoners”). 이에 따르면 어떤 수학문제에 대한 정답률이 17.7%인 LLM 모델(Large InstructGPT)에게 “차근차근 생각해 봐”라고 한마디 더 지시하면 정답률이 78.7%까지 높아진다는 것입니다. 통상적으로 일반적인 LLM 모델은 학습된 모델을 통해서 한번에 답을 찾으려 하지만, 이런 식으로 명령을 하게 되면 검토과정을 거치거나 추론 단계를 자체적으로 거쳐서 더 나은 결과를 가져올 수 있다는 것입니다. DeepSeek에서는 이러한 추론과정을 아예 강제함으로써 성능을 향상 시킬 수 있었을 것으로 생각됩니다.

기술문서에서는 통상적인 벤치마킹 결과 DeepSeek의 성능이 유수의 기존 서비스들과 유사하다고 하였습니다. 하지만 조금 어려운 추리문제 등에서는 GPT-o1보다 정답률이 떨어진다는 보고도 있습니다. 사실 GPT-o1은 작년 수능의 국어와 수학 문제를 풀 때 거의 만점을 받는다고 하니, GPT-4o보다 개선된 부분이 많은 것 같기도 합니다.

DeepSeek는 현재 무료로 사용 가능하지만, 보안 등의 이슈로 정부기관이나 공공공기관 등에서는 접속이 제한됩니다. 아쉽게도 휴대폰용 앱 역시 우리나라에서는 현재 다운로드가 되지 않습니다. 만약 업무에 활용하고자 한다면, 로컬에서 직접 설치하는 방법을 추천드립니다. LLM모델을 로컬에서 실행하게 해주는 Ollama를 설치한 후, ollama프롬프트에서 간단한 명령어로 모델 선택하여 다운로드 및 설치가 가능합니다. 윈도우, 맥, 리눅스 환경 모두 가능합니다. 파라미터의 개수가 가장 많은 DeepSeek-R1버전은 고성능 GPU와 128GB 이상의 메모리가 탑재된 고사양 컴퓨터가 필요하며, 증류 버전인 DeepSeek-R1-Distill-Qwen-1.5B은 일반적인 GPU 카드를 탑재한 PC에서도 충분히 실행이 가능합니다. 한글 사용을 고려한다면, 32B이상의 버전을 사용하는 것이 좋습니다.

DeepSeek의 발표로 인공지능서비스의 연구방향은 두 갈래로 나누어지고 있는 것 같습니다. 하나는 기존 LLM 모델이 추구하는 “Scaling은 계속된다”입니다. GPU의 처리속도가 점점 더 빨라짐에 따라, 더 많은 파라미터와 학습 데이터를 투입하여 고성능의 범용 인공지능 서비스를 개발하려는 움직임입니다. 다른 하나는 DeepSeek로 인해 가속화되는 “on premise” 또는 더 나아가 “on device”입니다. 개별 PC에서도 설치가 가능한 현재 버전의 DeepSeek만 잘 활용한다면, 이제는 특정 연구분야의 데이터만을 학습시킨 소규모 자체 인공지능 서비스를 제공할 수 있는 시기가 된 것 같습니다. 이와 함께 데이터의 중요성은 점점 더 커지고 있습니다. 지금까지 공개된 LLM 모델인 Llama3, Qwen, DeepSeek-R1 등도 어떤 학습 데이터로 어떻게 학습 시켰는지는 전혀 공개하지 않고 있습니다. 프로그램 코드는 공개하더라도 데이터는 공개하지 않는다는 것을 볼 때 어떤 데이터로 모델을 학습시키는가가 더 핵심적인 부분이란 생각도 듭니다.

작성자김판규
작성일2025-03-14
조회수253