[AI] 인공지능 관련 용어
1. 인공지능(AI)
인공지능(Artificial Intelligence, AI)은 사람의 지능을 모방하여 컴퓨터 시스템이 문제 해결과 의사 결정을 수행하는 기술을 말한다. AI는 기계 학습, 자연어 처리, 컴퓨터 비전 등 다양한 분야에서 활용되며 현재 많은 관심을 받고 있다.
2. 머신 러닝(Machine Learning)
머신 러닝(Machine Learning)은 AI의 한 분야로, 기계가 데이터를 학습하고 패턴을 인식하여 예측과 의사 결정을 할 수 있도록 하는 알고리즘과 기술을 의미한다. 대표적인 예로는 분류(classification), 회귀(regression), 군집화(clustering) 등이 있다.
3. 딥 러닝(Deep Learning)
딥 러닝(Deep Learning)은 머신 러닝 기법 중 하나로, 뉴럴 네트워크(Neural Network)를 이용하여 복잡한 데이터의 표현과 패턴을 학습하는 방법이다. 딥러닝은 대량의 데이터를 기반으로 하며, 이미지 인식, 음성 인식, 자연어 처리 등 다양한 분야에서 뛰어난 성능을 보여준다.
4. 강화 학습(Reinforcement Learning)
강화 학습(Reinforcement Learning)은 학습 시스템이 행동을 수행하고 이에 따라 보상을 받아 최적의 행동을 선택하는 방식이다. 강화 학습은 마치 게임에서 보상을 상승시키며 학습하는 과정과 유사하다. 딥마인드의 알파고(AlphaGo)는 강화 학습의 대표적인 예시로 알려져 있다.
5. 자연어 처리(Natural Language Processing, NLP)
자연어 처리(Natural Language Processing, NLP)는 인간의 언어를 기계가 이해하고 처리할 수 있도록 하는 기술이다. 텍스트 분류, 개체명 인식, 기계 번역, 감성 분석 등 다양한 언어 처리 작업에 활용된다.
6. 컴퓨터 비전(Computer Vision)
컴퓨터 비전(Computer Vision)은 디지털 이미지나 비디오에서 고차원 데이터를 추출하여 컴퓨터가 이해하고 처리하는 기술이다. 객체 검출, 분할, 인식 등과 같은 작업에 사용되며, 자율 주행 차량, 얼굴 인식, 의료 영상 분석 등 다양한 분야에서 활용되고 있다.
7. 데이터 마이닝(Data Mining)
데이터 마이닝(Data Mining)은 대규모 데이터에서 유용한 정보와 패턴을 발견하기 위해 다양한 분석 기술을 적용하는 과정이다. 데이터 마이닝은 비즈니스, 마케팅, 금융 등의 분야에서 예측, 분류, 요약, 군집화 등의 작업에 활용된다.
8. 인지 컴퓨팅(Cognitive Computing)
인지 컴퓨팅(Cognitive Computing)은 사람의 인지 능력을 컴퓨터 시스템에 적용하여 활용하는 기술이다. 기계 학습, 자연어 처리, 방대한 데이터 처리 등을 사용하여 의사 결정을 내리고 해석할 수 있다.
9. 분산 머신 러닝(Distributed Machine Learning)
분산 머신 러닝(Distributed Machine Learning)은 여러 대의 컴퓨터 또는 장치를 사용하여 대규모 데이터 세트를 처리하는 기술이다. 분산 머신 러닝은 빠른 학습 속도와 처리량을 보장하며, 클라우드 컴퓨팅과 협업하여 대용량 데이터 처리에 유용하다.
10. 대형 언어 모델(LLM, Large Language Model)
대형 언어 모델은 생성형 AI를 설명할 때 가장 먼저 이해해야 하는 개념이다. 대형 언어 모델이란, 말 그대로 광범위한 양의 텍스트 데이터를 학습한 모델을 뜻하는데 이 개념은 인간의 언어 능력 성장 과정을 생각하면 이해하기 쉽다.
어렸을 때는 언어에 대한 학습량이 적어 제한된 단어와 짧은 문장 위주의 대화만 가능하지만, 이후 교육 과정, 일상생활 속에서의 대화, 독서, 인터넷 등 학습을 통해 언어 능력이 자연스럽게 성장한다. 이 과정에서 이해력과 추론 능력도 함께 높아지며, 대화 수준과 답변의 정확도가 향상된다.
대형 언어 모델도 이와 유사하게 방대한 양의 언어 데이터를 학습하면서, 기본적인 지식을 습득하게 된다. 인간의 글과 대화 방식을 받아들이며 더욱 정교하고 자연스러운 대화 능력을 갖춰간다. 오늘날 대부분의 텍스트 기반 생성형 AI 서비스는 이 대형 언어 모델을 기반으로 작동한다.
11. GPT(Generative Pre-trained Transformer)
앞에서 대형 언어 모델이 거대한 양의 언어 데이터를 학습한 모델이라고 설명했는데 단순하게 많은 양의 데이터를 학습했다고 해서 인간과 유사하게 대화할 수는 없다. 이 개념 역시 인간의 학습 과정으로 예를 들어보겠다.
인간의 경우 언어 학습을 많이 할수록 작문 능력도 동시에 향상될 수 있지만, 항상 비례하는 것은 아니다. 지식을 쌓는 일과 작문 능력은 또 다른 능력이기 때문. 인간이 작문 실력을 키우기 위해 별도의 훈련을 하듯, 대형 언어 모델도 단순한 학습을 넘어 인간처럼 말하기 위한 전문적인 훈련이 필요로 하는데, 이를 잘 수행한 모델이 바로 미국의 인공지능 연구소 OpenAI에서 만든 ‘ChatGPT’ 다.
ChatGPT는 채팅을 뜻하는 ‘Chat’과 ‘GPT’를 결합한 용어로, 여기에서 말하는 ‘GPT’는 대형 언어 모델의 대표적인 예시이자, 인간처럼 말할 수 있도록 잘 훈련된 모델이다. GPT는 이름에서 알 수 있듯 ‘트랜스포머(Transformer)’라는 아키텍처를 기반으로 하며, 이는 인간의 언어 처리 방식을 모방한 자연어 처리 분야의 심층 신경망 구조를 말한다.
ChatGPT 알아보기
12. 프롬프트 엔지니어링(Prompt Engineering)
생성형 AI 시대가 도래하면서 영어가 가장 중요한 역량이 될 것이라는 의견도 있는데, 이는 생성형 AI 서비스의 작동 방식에 기인한 것이다. 생성형 AI 서비스는 사용자의 특별한 행위 없이 오로지 질문과 요청에 의해 원하는 결과를 제공하고, 초기 모델의 경우 영어 기반의 학습 데이터 비중이 높기 때문이다. 특히 영어로 대화했을 때 가장 효과적인 답변을 받을 수 있었다. 이때 AI에 주어지는 입력, 즉 질문이나 명령을 ‘프롬프트(Prompt)’라 부른다.
즉, 어떻게 질문을 하느냐에 따라 결과가 크게 달라질 수 있는데, 많은 기업이 이를 효과적으로 활용하여 업무 생산성을 높이기 위해 ‘프롬프트 엔지니어’라는 직업이 탄생하기도 했다. 프롬프트 엔지니어는 최적의 결괏값을 얻어낼 수 있도록 효과적인 프롬프트 값을 입력하는 업무를 담당하며, 이 과정에서 사용되는 기술을 ‘프롬프트 엔지니어링’이라고 부른다. 프롬프트 엔지니어링에 관한 간단한 예시는 아래와 같다.
효과적이지 못한 질문 : "이탈리아 여행 계획을 세워주세요."
이 질문은 목적지만 명시되어 있을 뿐, 여행 기간, 선호하는 활동, 방문하고 싶은 도시 등에 대한 정보가 없기 때문에, AI는 사용자의 선호도와 관심사에 대해 추측해야 한다. 따라서 불분명하거나 사용자의 기대에 부합하지 않는 계획을 제안할 확률이 높다.
효과적인 질문 : "이탈리아 여행을 위한 7일 일정 계획을 세워주세요. 저는 로마, 피렌체, 베니스를 꼭 방문하고 싶으며, 역사적인 장소와 현지 음식을 경험하고 싶습니다. 계획표는 표 형태로 작성해 주세요."
이 질문은 여행 목적지, 기간, 관심사 등 구체적인 정보를 포함하고 있기 때문에, AI는 이 정보를 바탕으로 구체적인 여행 계획을 제안할 수 있다. 또한 표 형태로 출력을 요청하여 별도의 정리 없이 바로 출력할 수 있다.
13. 멀티 모달(Multi-Modality)
최초의 ChatGPT는 텍스트 기반의 대화에만 국한되어 있었다. 사용자가 텍스트로만 질문할 수 있었고, 답변도 오직 텍스트로만 받을 수 있었다는 의미인데, 지금의 ChatGPT는 텍스트로 특정 이미지를 생성해 달라고 하면 이미지를 생성해 주고, 텍스트가 아닌 음성으로 질문을 하더라도 텍스트 나 이미지로 답변을 받을 수 있다. 이때 텍스트, 음성, 이미지 등을 모달리티(Modality)라 부르며, 다양한 형태의 모달리티를 입력 및 출력에 제한 없이 활용하는 방식을 ‘멀티 모달(리티)’라고 한다.
이 역시 일반 인공 지능으로 가는 중간 단계라고 할 수 있는데, 인간이 눈과 귀를 통해 정보를 습득(인풋)하고, 취득한 정보를 기반으로 뇌를 활용하여 생각하며, 입으로 말하거나 손과 발로 작업(아웃풋)을 수행하는 것처럼 AI 역시 다양한 감각 기관을 갖추는 과정이라 이해할 수 있다.
14. 줄임말 음성 텍스트 변환(STT, Speech To Text)
STT는 Speech To Text의 줄임말로 음성을 텍스트로 변환해 주는 기술을 말하며, TTS는 Text To Speech의 줄임말로 텍스트를 음성으로 변환해 주는 기술을 말한다. 즉, 입력 형태와 출력 형태가 다른 경우에 사용되는 용어라고 이해하면 된다.
최근에는 기술의 발전으로 인해 Text To Image, Speech To Video 등과 같이 다양하게 활용되고 있다.