본문 바로가기
공부

컴퓨터 개론 06 인공지능과 딥러닝

by 라이티아 2025. 4. 13.

1. 인공지능 개요

1. 인공지능이란

인공지능

사고나 학습 문제해결 능력 등 인간 지능 수준의 지적 능력을 컴퓨터 하드웨어와 소프트웨어로 구현하는 기술

 

인공지능은 강한 인공지능과 약한 인공지능으로 구분됨

 

강한 인공지능

인간처럼 생각하고 행동하는 인공지능을 말함

범용 인공지능 / 슈퍼 인공지능으로 분류됨

아직 인류가 도달하지 못한 레벨임

 

약한 인공지능

특정 데이터를 입력하고 프로그램을 통해 학습시킴으로써 특정한 문제를 해결하는 인공지능

좁은 인공지능이라고 함

현재 시대의 레벨임

 

2. 인공지능 역사

1940 - 1950 인공지능 태동기

1943 워렌 맥컬릭

인간 두뇌 신경에서 착아한 논리적 모델을 제시

= 인공신경망 퍼셉트론의 원류임

 

1950 앤런 튜링

튜링 테스트 제안

 

1956 존 매카시

인공지능 용어 처음 사용

 

1957 프랭크 로젠블랫

인공신경망의 근간이 되는 퍼셉트론 개발

인간의 뇌 신경에서 아이디어를 얻어 여러 신호를 입력받아 하나의 신호를 출력하는 모델

 

기호주의와 연결주의

기호주의

인간의 지능과 지식을 기호화 하여 학습시키는방법

 

연결주의

두뇌 신경 조직을 모형화하고 여려 신경을 네트워크 구조로 연결해 연결 강도를 학습시키는 방법

 

1950 초반에는 현실적인 기호주의가 선호됨

전문가 시스템임

 

인공지능의 첫 번째 겨울

1969 기호주의의 마빈 민스키와 시모어 페퍼드가 퍼셉트론이 XOR와 같은 문제도 해결이 불가능함을 증명함

다중 퍼셉트론으로 해결은 되지만 학습시킬 방법이 없다

기호주의의 한계점

1970년 전반에 거쳐서 겨울이 옴

 

다시 활성화 시킨것은 기호주의의 전문가 시ㅡ템의 발전임

 

오차역전파

1986 저프리 힌튼 오차역전파 알고리즘으로 다중 퍼셉트론을 학습시키는데 성공함

 

인공지능의 두 번째 겨울

1990년대에 접어들며 인력 데이터에서 특징이 증가하며 구조가 복잡해져 문제가 발생

경자소실, 과적합, 극소 등의 문제 발생

 

2000년대 중반까지 겨울이 발생

 

딥러닝의 중흥기

1998 얀 르쿤이 합성곱 신경망이라는 기술 발표

2006년 심층 신경망도 학습이 가능하다는 것을 발표

이를 딥러닝이라고 함

 

1970 첫 겨울

1990 두번째 겨울

현재 가장 활성화 됨

 

3. 일상에서의 인공지능

음성인식과 번역, 자연어처리

 

영상인식과 의료영상 분석

 

소설과 작곡 등의 예술 분야

 

이미지와 동영상 모방 생성

 

추천서비스, 이상 감지 등에 사용되는 인공지능

 

4. 인공지능의 미래와 윤리 강조

인공지능의 미래 특이점 순간

특이점

인공지능이 인간 뇌의 능력을 넘어서는 순간

 

인공지능 윤리

 

2. 머신러닝과 딥러닝

1. 인공지능과 머신러닝, 딥러닝

머신러닝 안에 딥러닝이 있음

 

머신러닝의 정의와 이해

1959 아서 사무엘 머신러닝 용어 사용

 

머신러닝

컴퓨터가 인간처럼 학습하고 행동하도록 하는 과학

관찰 및 실제 단어의 상호작용 형태로 데이터와 정보를 제공함으로써 시간이 지남에 따라 자율적으로 학습을 향상시키는 과학이다

 

기계학습이라고 하기도 함

주어진 데이터를 기반ㅇ로 기계가 스스로 학습하여서 성능을 향상시키거나 최적의 해답을 찾기 위한 지능적 학습 방법임

 

머신러닝과 전통적 프로그래밍의 차이

전통적 프로그래밍

입력데이터 + 프로그램 = 아웃풋

 

머신러닝

입력데이터 + 아웃풋 = 프로그램

 

2. 머신러닝 절차와 주요 용어

머신러닝 수행 과정

첫 번째 단어

데이터 수집

수집된 데이터의 품질과 양에 따라 예측 모델의 선능이 결정되기 때문

 

데이터 전처리 단계

누락된 값을 체우고 이상 값을 수정하거나 제거함, 잘못된 값음 수정하는 데이터 정리를 함

 

정규화

값을 비슷한 크기로 고르는 것

 

모델 학습

적절한 모센러닝 모델을 생성해 데이터로 학습시킴

 

1. 데이터 수집

2. 데이터 전처리

3. 모델 학습

4. 모델 성능 시험과 개선

5. 데이터와 결과 시각화

 

데이터와 특징

머신러닝은 데이터에 숨겨진 정보를 찾는 분야

데이터가 매우 중요함

 

머신러닝의 데이터 = 데이터 셋

 

머신러닝 모델

내부의 알고리즘으로 특정 유형의 패턴을 인식하여 문제를 해결하도록 고안된 결과물

주어진 문제를 해결하기 위해 데이터로 알고리즘을 학습시키면 바로 머신러닝 모델이 생성됨

 

학습 데이터와 테스트 데이터

데이터는 크게 학습 데이터 / 테스트 데이터로 나눔

 

학습 데이터

합습에 사용되는 데이터

 

테스트 데이터

학습이 잘 되었는지 최종 검사에 사용되는 데이터

 

학습 데이터는 다시 학습 데이터와 검증 데이터로 나뉨

 

검증 데이터

학습 향상을 점검하기 위해 치르는 모의고사 같은것

 

머신러닝 대상 문제 : 회귀와 분류

회귀

가격 급여 연령 온도와 같은 연속값을 예측하는 분제

목표 값을 더 정확하게 예측할 수 있는 선을 찾음

 

분류

남성 여성  춥고 더움  참 거짓과 같은 불연속 이산값을 예측하는 문제

분류 문제에서 구분해야 할 유형을 클래스라고도 부름

데이터 세트를 여러 클래스로 분류 가능한 결정 경계를 찾는 과정

 

머신러닝 비지도 학습 문제 : 군집화

군집화

정답이 없이 주어진 데이터들을 유사한 특성을 가진 그룹으로 분리하여 군집으로 나누는 일

 

3. 다양한 머신러닝 기술 분야

머신러닝 분류

지도 학습, 비지도 학습, 반지도 학습, 강화 학습으로 나뉨

 

지도 학습

문제와 정답을 모두 알려주고 공부시키는 방법

 

반지도 학습

지도 학습과 비지도 학습을 섞어서 사용하는 학습 방식

 

비지도 학습

답을 알려주지 않고 공부시키는 방법

 

강화학습

보상을 얻기 위한 정책을 다음 행동에 반영시키는 방법

 

지도 학습과 활용

정답이 있는 훈련 데이터로 부터 입출력 간의 함수인 모델을 학습시키는 방법

 

분류와 회귀 문제를 해결함

 

분류

주어진 데이터를 정해진 정답 유형에 따라 분류하는 문제

 

회귀

입력 데이터로 부터 연속된 출력값을 예측하는 문제

 

비지도 학습과 활용

정답이 없는 훈련 데이터를 사용하여 데이터 내에 숨어있는 어떤 관계를 찾아 내는 방법

정답 레이블에 없는 데이터를 비슷한 특정끼리 군집화해 새로운 데이터에 대한 결과를 예측하는 방법임

 

지도 학습보다 더 어렵다고 할 수 있음

 

반지도는 지도와 반지도를 섞어서 사용함

 

대표적 종류는 군집화임

 

강화학습과 활용

주어진 현재 상황에서 보상을 최대화 하도록 다음 행동을 학습시키는 방법

 

4. 지도 학습의 대표적 알고리즘

선형 모델

데이터 특성에 대한 선형 함수를 만들어 예측하는 기법

 

K-최근접 이웃 알고리즘 KNN

새로운 자료에 대해 기준으로 정한 가장 근접한 이숫 K개 중에서 가장 많은 유형으로 분류하는 방법

 

5. 비지도 학습의 대표적 알고리즘

K-평균 군집화 알고짐

주어진데이터를 비슷한 K개의 군집으로 묶는 알고리즘

 

정답이 없는 입력 데이터에 정답을 붙이는 역할에 주로 사용됨

 

자원 축소

특징 수를 줄이는것

 

3. 인공신경망과 딥러닝

1. 퍼셉트론과 인공신경망

MCP와 퍼셉트론

1957 프랭크 로젠블랫 세계 최초로 인공 신경망인 퍼셉트론을 제시

퍼셉트론

다수의 신호를 받아 하나의 신호를 출력

 

가중치와 편향

 

활성화 함수

퍼셉트론에서 최종 값을 결정하는 함수

 

간단한 인공신경망 이해

 

다층 퍼셉트론과 심층신경망

 

 

 

내용 점검 문제

  1. A
  2. C ??
  3. B
  4. D
  5. D
  6. C ??
  7. B
  8. D
  9. A
  10. A
  11. ??
  12. ??
  13. ??
  14. ??
  15. ??
  16. ??
  17. ??
  18. ??
  19. ??
  20. ??

괄호 채우기

  1. 특이점
  2. ?? 적대적 생성 신경망 ??
  3. 딥페이크
  4. 연결주의
  5. 학습데이터
  6. 군집화
  7. 강화학습
  8. 레이어
  9. ??
  10. ??

 

 

번호사용자 답정답정오 여부해설

1 A A 퍼셉트론의 원류는 맥컬러치와 피츠, 튜링은 관련 없음
2 C A 머신러닝 내에 인공신경망이 포함됨 → A는 거꾸로 설명
3 B B 머신러닝은 프로그래머가 직접 규칙을 정의하지 않음
4 D D 머신러닝 수행 순서: 수집 → 전처리 → 학습 → 평가 → 시각화
5 D D 레이블은 데이터의 ‘정답’, 인스턴스와 다름
6 C A 회귀는 연속값 예측, 이산값 아님
7 B B 군집화는 비지도 학습
8 D D 보상 최대화는 강화 학습
9 A D 지도학습 알고리즘: 선형 모델, KNN이 모두 포함된 D

번호사용자 답정답정오 여부설명

1 특이점 특이점 인간 지능 초월 지점: 기술적 특이점
2 적대적 생성 신경망 적대적 생성 신경망 (GAN) GAN: 생성자 vs 판별자
3 딥페이크 딥페이크 GAN 기반 가짜 콘텐츠
4 연결주의 연결주의 뇌 신경 모방 방식
5 학습데이터 훈련 데이터 Training Data, Test Data와 구분
6 군집화 군집화 비지도 학습의 대표
7 강화학습 강화학습 보상 기반 학습
8 레이어 은닉층(hidden layer) Layer도 맞지만 정답 표현은 은닉층
9 ? 심층 신경망 딥러닝 정의: 다층 은닉층 포함 신경망
10 ? 다중 선형회귀 다중 입력 속성 → 다중 선형회귀