brandLogo

BigValue Insight <3>💡

2025년 6월 19일

image

[BigValue Insight] 는 다양한 산업 분야에 대한 깊은 이해를 바탕으로 업계 전문가로 성장할 수 있도록,


트렌드·실무 인사이트·산업 지식·그리고 성장에 필요한 모든 이야기들을 공유하기 위해 운영되고 있습니다.


세 번째 세션은 <인공지능이란 무엇인가_2부>를 주제로, 구름 대표님께서 연사로 나서 인공지능에 대한 본질적인 이야기에 대해 다루어 보았습니다.


핵심만 살펴보는 오늘 아티클, 함께 살펴보실까요?

image

BigValue Insight - 1. 딥러닝 시대의 개막: 알렉스넷과 뉴럴 네트워크의 부활

image

2012년, 제프리 힌튼 교수의 연구팀이 발표한 '알렉스넷(AlexNet)'은 딥러닝 시대의 서막을 알리는 중요한 사건이었습니다.
알렉스넷은 당시 이미지 인식 분야에서 압도적인 성능을 보이며 인공신경망, 즉 뉴럴 네트워크의 잠재력을 다시 한번 입증했습니다.


그렇다면 뉴럴 네트워크는 어떻게 작동할까요?


기본적인 원리는 우리가 익숙한 Y = AX + B와 유사합니다.

뉴럴 네트워크의 최소 단위인 '뉴런'은 여러 입력값(X)에 가중치(W)를 곱하고 편향(B)을 더한 뒤, 활성화 함수를 거쳐 하나의 출력값을 만들어냅니다.
이 과정은 통계학에서 오차를 줄여가며 최적의 선을 찾는 과정과 본질적으로 같습니다.

BigValue Insight - 2. 뉴럴 네트워크의 확장성: 조립식 AI의 탄생

image
image

​뉴럴 네트워크의 가장 큰 강점은 바로 '조립식'이라는 점입니다.


하나의 뉴런이 데이터를 처리하는 방식은 간단하지만,

이러한 뉴런들을 여러 겹으로 쌓아 올리고 서로 연결함으로써 무한히 확장 가능한 구조를 만들 수 있습니다.


이를 '은닉층(Hidden Layer)'이라고 하는데, 은닉층이 많아질수록 모델은 데이터를 다양한 관점에서 분석하고 복잡한 패턴을 학습할 수 있게 됩니다.


예를 들어, 사람의 건강 상태를 예측할 때 혈액 검사, 외형, 심박수 등 여러 정보를 동시에 고려하는 것처럼

뉴럴 네트워크는 이러한 다차원적인 정보들을 개별 누런과 층을 토애 처리하고 종합하여 최종적인 결과물을 도출합니다.


이렇나 조립식 특성 덕분에 인공지능 연구자들은 더 이상 데이터에 맞는 공식을 고민을 줄이고,
뉴런을 이어 붙여 모델을 만들고 학습시키는 방식으로 연구 패러다임을 전환할 수 있었습니다.

BigValue Insight - 3. 뉴럴 네트워크의 학습 원리: 복잡한 데이터에 대한 적합

image
image

​뉴럴 네트워크는 뉴런의 개수가 늘어날수록 데이터에 대한 '적합도(Fit)'가 크게 향상됩니다.

예를 들어, 비선형적 데이터를 하나의 뉴런으로는 정확히 설명하기 어렵지만,
뉴런의 개수를 늘리고 층을 깊게 쌓으면 데이터의 복잡한 패턴까지도 정확하게 학습할 수 있습니다.


뉴럴 네트워크의 학습 과정은 오차를 최소화하기 위해 가중치 공간에서 계속해서 공을 굴리며 최적의 위치를 찾아가는 것과 같습니다.

충분하 자원만 제공된다면, 뉴럴 네트워크는 어떤 데이터에도 핏을 맞출 수 있는 뛰어난 학습 능력을 가지고 있습니다.


이는 뉴런이 많아질수록 데이터를 해석하고 정보를 전달할 수 있는 통로가 무수히 많아지기 때문이며, 미세한 움직임까지도 모델 내에 담아낼 수 있게 됩니다.

BigValue Insight - 4. 뉴럴 네트워크의 응용 분야: 이미지, 시계열, 언어 모델

image
image

뉴럴 네트워크의 핵심은 '데이터만 있다면 무엇이든 분석 가능하다'는 점입니다.
이는 충분한 데이터만 보장된다면, 다양한 분야로의 무한한 응용 가능성을 의미합니다.


✅이미지 인식
이미지는 픽셀 단위의 색상 정보로 이루어진 데이터 덩어리입니다.
뉴럴 네트워크는 이미지 내의 선, 형태, 객체 등의 특징을 학습하여 이미지를 분류, 특정 객체를 검출 또는 이미지 내의 영역을 분할하는데 활용됩니다.
여러분이 구글에 이미지를 검색하거나 스마트폰으로 사진을 찍어 특정 대상을 인식하는 모든 과정에 뉴럴 네트워크가 사용됩니다.


✅시계열 데이터 분석

주가 예측처럼 시간에 따라 변화하는 데이터도 뉴럴 네트워크의 중요한 응용 분야입니다.
과거의 시계열 데이터를 입력값으로 사용하여 뉴럴 네트워크를 학습시키면 데이터 흐름의 맥락을 이해하고 미래 값을 예측할 수 있게 됩니다.


✅언어 모델
언어 역시 단어의 순서와 확률 분포로 이루어진 시계열 데이터로 볼 수 있습니다.
모든 단어를 숫자로 변환하는 '토큰화' 과정을 거친 후,
이 토큰의 흐름을 뉴럴 네트워크로 학습시키면 문맥을 이해하고 다음 단어를 예측하는 언어 모델을 만들 수 있습니다.
이는 구글 번역기나 파파고와 같은 번역 서비스의 기반이 되었습니다.

BigValue Insight - 5. LLM의 탄생과 발전: GPT 모델의 이해

image
image

​언어 모델은 문장이 길어질수록 과거의 정보를 잊어버리는 한계가 있었습니다.

이를 극복하기 위해 구글은 2017년 '어텐션(Attention)' 모델을 제안했습니다.
어텐션 모델은 문장 내에서 중요한 단어들에 더 집중하고, 해당 단어들과의 연관성을 파악하여 문맥을 이해하는 방식입니다.
이 어텐션 모델을 기반으로 GPT와 같은 대규모 언어 모델(LLM)이 탄생했습니다.

LLM은 인터넷의 방대한 텍스트 데이터를 학습하여 만들어집니다.
수백 기가바이트에 달하는 데이터를 학습하면 최종적으로 수십 기가바이트 크기의 '가중치 덩어리'로 압축됩니다.

이 가중치 덩어리가 바로 LLM의 핵심으로, 수많은 정보와 지식이 담겨 있습니다.
LLM을 학습시키는 데에는 수개월에 걸친 막대한 컴퓨팅 자원이 필요하며, 이는 OpenAI나 구글과 같은 거대 기업만이 감당할 수 있는 수준입니다.

이 거대한 가중치 덩어리 자체가 복잡한 지식과 패턴을 내포하고 있으며, 설계만 잘한다면 아무리 큰 데이터도 모두 학습하여 녹여낼 수 있습니다.

BigValue Insight - 6. LLM 서비스화 과정: Fine-tuning과 RLHF

image
image

​프리트레이닝된 LLM은 방대한 지식을 가지고 있지만, 그대로는 실생활에 유용한 서비스를 제공하기 어렵습니다.

예를 들어, 토큰의 순서만 학습했기 때문에 질문에 대한 답변보다는 확률 분포에 따른 단어만 나열할 수 있습니다.


이를 실제 서비스에 활용하기 위해서는 두 가지 중요한 과정이 필요합니다.

지도 미세 조정(Supervised Fine Tuning, SFT)
프리트레이닝된 LLM에 질문-답변 형식의 대화 데이터를 학습시켜 특정 목적에 맞게 모델의 가중치를 미세 조정합니다.
이 과정을 통해 LLM은 질문에 대한 적절한 답변을 생성하는 능력을 갖추게 되어 채팅 서비스가 가능해집니다.


인간 피드백 기반 강화 학습(Reinforcement Learning from Human Feedback, RLHF)
SFT를 거친 모델이 유해하거나 부적절한 답변을 생성하는 것을 방지하기 위해 사용됩니다.
사람이 모델의 답변에 점수를 매기고, 이 피드백을 바탕으로 모델이 학습하여 올바른 답변을 강화하고 잘못된 답변을 줄여나가도록 합니다.

이 과정은 많은 시간과 전문가의 노력을 필요로 하지만, 모델의 안정성과 윤리성을 확보하는 데 필수적입니다.
최근에는 사람의 피드백 없이도 정답 여부를 기준으로 강화 학습을 진행하는 방식도 연구되고 있습니다.


이러한 과정을 거쳐 LLM은 단순한 토큰 나열 기계에서 벗어나,

사용자의 의도를 이해하고 유용한 정보를 제공하는 실제 서비스 모델로 발전하게 됩니다.

BigValue Insight - 7. LLM의 한계와 극복 노력: Hallucination과 Contextual Knowledge

image
image

LLM은 비약적인 발전을 이루었지만, 여전히 몇 가지 한계를 가지고 있습니다. 가장 대표적인것이 '환각(Hallucination)' 현상입니다.

LLM은 확률 분포에 기반하여 다음 단어를 생성하기 때문에, 때로는 사실과 다른 엉뚱한 답변을 마치 사실인 것처럼 제시하기도 합니다.

이러한 환각 현상을 줄이기 위한 노력 중 하나가 '컨텍스트 지식(Contextual Knowledge)'의 활용입니다.
모델이 답변을 생성할 때 학습된 '내장 지식(Parametric Knowledge)'보다 사용자 입력에 포함된 '컨텍스트 데이터'를 더 신뢰하도록 만드는 것입니다.

이를 위해 '시스템 프롬프트(System Prompt)'와 같은 기술이 사용됩니다.
시스템 프롬프트를 통해 사용자의 의도나 답변의 스타일, 필요한 정보 등을 사전에 제시하면,
LLM은 이 지시 사항을 최우선으로 고려하여 답변의 정확도를 높일 수 있습니다.


또한, 최신 데이터를 실시간으로 LLM에 제공하기 위해 '랭체인(Langchain)'과 같은 라이브러리가 등장했습니다.
랭체인은 LLM이 외부 데이터베이스를 조회하거나 특정 도구를 활용할 수 있도록 돕는 역할을 합니다.


최근에는 외부 도구와 연동 방식을 표준화하는 'MCP 프로토콜'이 제안되어, LLM이 더욱 효율적으로 외부 정보와 상호작용할 수 있도록 발전하고 있습니다.

BigValue Insight - 8. 빅밸류의 AI 활용 전략: MCP 프로토콜과 데이터 허브 연동

image
image

빅밸류는 이러한 인공지능 기술의 최전선에서 비즈니스 가치를 창출하기 위해 노력하고 있습니다.

특히, MCP 프로토콜을 활용하여 LLM과 자사의 '데이터 허브'를 연동하는 전략을 추진하고 있습니다.


빅밸류 플랫폼과 MCP 프로토콜을 통해 LLM과 연결되어, 데이터 허브에 저장된 방대한 빅밸류 데이터를 LLM이 조회하고 활용할 수 있도록 돕습니다.

예를 들어, LLM이 대한 질문을 받으면 빅밸류 데이터 허브의 데이터 마트에서 필요한 정보를 텍스트 형태로 조회하고, 이를 시스템 프롬프트에 담아 LLM에 전달하는 방식입니다. 이렇게 연동된 시스템을 통해 LLM은 "북창동 식당 추천"과 같은 질문에 대해 실제 카드 매출 정보 등을 기반으로 한 구체적인 답변을 제공할 수 있게 됩니다.

BigValue Insight - 9. 결론: 인공지능 시대, 우리의 역할과 미래

오늘날 인공지능 시장은 뉴럴 네트워크를 기반으로 무한히 확장되고 있습니다.

과거에는 통계학자나 소수의 전문가만이 접근할 수 있었던 복잡한 데이터 분석과 모델 설계가,
이제는 뉴럴 네트워크의 '조립식' 특성과 GPU의 강력한 연산 능력 덕분에 누구나 쉽게 접근하고 활용할 수 있는 대중적인 기술이 되어가고 있습니다.

빅밸류는 이러한 기술의 흐름 속에서 우리가 어떻게 하면 더 높은 가치를 창출할 수 있을지 끊임없이 고민하고 있습니다.
인공지능 시대를 선도하기 위해서는 기술의 기본적인 이론과 개념을 명확히 이해하고, 실제 비즈니스 문제에 적용할 수 있는 역량을 키우는 것이 중요합니다.

BigValue Insight - 🗨️후기 Talk


💡알고 있던 기술들이 실제로 어떻게 등장하고 발전했는지에 대한 흐름을 듣고 나니, ㅠ이 되었습니다.


💡LLM이 단순히 '답변하는 도구'가 아니라, 방대한 학습과정과 설계 철학이 담긴 결과물이라는 점이 인상 깊었습니다.


💡AI의 발전이 단순한 기술 혁신이 아니라, 반복된 실패와 축적의 결과라는 점이 인상 깊었습니다.


💡단일 뉴런의 한계에서 시작해, 은닉층을 쌓아가며 복잡한 패턴을 학습해나가는 뉴럴 네트워크의 구조를 이해하는 과정이 흥미로웠습니다.
'구조를 설계한다'는 개념이 더 명확해졌습니다.



빅밸류는 데이터로 세상을 풍요롭게 만들기 위해, 동료의 무한한 성장을 지원합니다 🚀

아티클 홈으로 돌아가기
주소: 서울특별시 중구 서소문로 138 대한일보빌딩 12층대표전화: 070.7762.9364
sns
made withlogo
TOP