'머신러닝&딥러닝'에 해당되는 글 3건

  1. 2017.12.18 계단 함수(Step Function)
  2. 2017.12.18 인공 신경망
  3. 2017.12.16 퍼셉트론

1. 계단 함수

 

계단 함수는 아래의 식과 같이 입력이 0을 넘으면  1을 출력하고, 그 외에는 0을 출력하는 함수이다.

 

h(x) = 0 (x<= 0)
     = 1 (x > 0)

 

1.1 계단 함수 구현

 

step_function.py

# coding: utf-8
import numpy as np
import matplotlib.pylab as plt


def step_function(x):
    return np.array(x > 0, dtype=np.int)

X = np.arange(-5.0, 5.0, 0.1) # -5.0에서 5.0 전까지 0.1 간격의 넘파이 배열을 생성
Y = step_function(X) # 계단 함수 실행 결과는 배열로 리턴
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)
plt.show()

 

 

1.2 계단 함수의 그래프

 

 

Github: https://github.com/hwauni/MachineLearning/tree/master/ML_alg/StepFunction

'머신러닝&딥러닝 > 알고리즘' 카테고리의 다른 글

인공 신경망  (0) 2017.12.18
퍼셉트론  (0) 2017.12.16
Posted by 이성윤

1. 인공 신경망

 

위키: https://ko.wikipedia.org/wiki/%EC%9D%B8%EA%B3%B5%EC%8B%A0%EA%B2%BD%EB%A7%9D

인공신경망(人工神經網, 영어: artificial neural network, ANN)은 기계학습인지과학에서 생물학의 신경망(동물의 중추신경계중 특히 )에서 영감을 얻은 통계학적 학습 알고리즘이다. 인공신경망은 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델 전반을 가리킨다.

 

인공 신경망은 사람의 두뇌가 여러 개의 뉴론으로 연결돼서 복잡한 연산을 수행한다는 데서 영감을 받아서, 머신러닝의 연산을 여러 개의 간단한 노드를 뉴론 처럼 상호 연결해서 복잡한 연산을 하겠다는 아이디어이다.

 

입력층, 은닉층, 출력층

 

 

              

x1, x2, 1이라는 3개의 신호가 뉴런에 입력되어, 각 신호에 가중치를 곱한 후, 다음 뉴런에 전달한다. 다음 뉴런에서는 이들 신호의 값을 더하여, 그 합이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력한다. 이를 확장하여 가중치가 달린 입력 신호와 편향의 총합을 계산하고, 이를 a라 한다. 그리고 a를 함수 h()에 넣어 y를 출력하게된다.

 

y = h(b + w1x1 + w2x2)
h(x) = 0 (x<= 0)
     = 1 (x > 0)

 

입력 신호의 총합을 출력 신호로 변환하는 함수를 일반적으로 활성화 함수(activation function)이라 한다.

 

1.1 Activation Functions

 

인공 신경망 모델에서 뉴런의 주요 기능은 입력과 연결 강도의 가중합을 구한 다음 활성화 함수에 의해 출력을 내보내는 것이다. 따라서, 어떤 활성화 함수를 선택하느냐에 따라 뉴런의 출력이 달라질 수도 있다.


참조: https://www.quora.com/What-is-the-role-of-the-activation-function-in-a-neural-network-How-does-this-function-in-a-human-neural-network-system

 

※ "h(x) = 0 (x<= 0) = 1 (x > 0)"와 같은 활성화 함수는 임계값을 경계로 출력이 바뀌는데, 이런 함수를 계단 함수(step function)라 한다. 퍼셉트론에서는 활성화 함수로 계단 함수를 이용한다.

 

활성화 함수의 종류는 다양하며 어떤 활성화 함수를 쓰느냐에 따라서 학습 속도나 정확도가 달라지게 된다.

'머신러닝&딥러닝 > 알고리즘' 카테고리의 다른 글

계단 함수(Step Function)  (0) 2017.12.18
퍼셉트론  (0) 2017.12.16
Posted by 이성윤

퍼셉트론은(Perceptron)은 프랑크 로젠블라트(Frank Rosenblatt)가 1957년에 고안한 알고리즘이다.

이 알고리즘은 퍼셉트론이 신경망(딥러닝)의 기원이 되는 알고리즘이기 때문에 꼭 알아야 하는 개념이라고 생각한다.


1. 퍼셉트론이란?

퍼셉트론은 다수의 신호를 입력으로 받아 하나의 신호를 출력한다. 여기서 말하는 신호란 전류나 강물처럼 흐름이 있다는 것을 생각하면 된다. 전류가 전선을 타고 흐르는 전자를 내보낸듯, 퍼셉트론 신호도 흐름을 만들고 정보를 앞으로 전달한다. 다만, 실제 전류와 달리 퍼셉트론 신호는 '흐른다/안 흐른다(1 or 0)'의 두 가지 값을 가질 수 있다.

 

 

입력신호: x1,x2

가중치: w1,w2

출력신호:y

원: 뉴런 또는 노드

 

입력 신호가 뉴런에 보내질때는 각각 고유한 가중치가 곱해진다. 뉴런에서 보내온 신호의 총합이 임계치를 넘어설 때만 1을 출력한다.

 

이를 수식으로 나타내면 아래와 같다.

 

세타(θ)를 -b로 치환하면 아래와 같은 식이 된다.

※ b는 편향(bias)이라 하며, w1과w2는 가중치이다. 퍼셉트론은 입력신호에 가중치를 곱한 값과 편향을 더하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력한다. 가중치는 각 입력신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수고, 편향은 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수이다.

 

퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여한다.  가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용한다. 가중치가 클 수록 해당 신호가 그만큼 더 중요하다는것을 뜻한다.

 

※ 가중치는 전류에서 말하는 저항에 해당한다. 저항은 전류의 흐름을 억제하는 매개변수로, 저항이 낮을수록 큰 전류가 흐른다. 한편 퍼셉트론의 가중치는 그 값이 클수록 강한 신호를 흘려보낸다. 이처럼 서로 작용하는 방향은 반대지만, 신호가 얼마나 잘(혹은 어렵게) 흐는가를 통제한다는 점에서 저항과 가중치는 같은 기능을 한다.

※ 편향이라는 용어는 "한쪽으로 치우쳐 균형을 깬다"라는 의미를 담고 있다.

 

 

1.1 AND 게이트

                                                         [AND 게이트 진리표]

 

AND 게이트를 퍼셉트론으로 표현하려면 어떻게 해야할까? W1, W2, θ 값을 정하여 조건을 충족하는 퍼셉트론을 만들어야 한다.

Ex) 0.5*x1+0.5*x2 > 0.7

       0.5*x1+0.5*x2 > 0.8

 

AND 게이트 조건을 만족하는 매개변수 조합은 무수히 많다.

 

and_gate.py

 

# coding: utf-8
import numpy as np


def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = AND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

 

1.2 NAND 게이트

                                                         [NAND 게이트 진리표]

 

NAND게이트는 AND 게이트를 구현하는 매개변수의 부호를 반전

Ex) -0.5*x1-0.5*x2 > -0.7
       -0.5*x1-0.5*x2 > 0.8

 

NAND 게이트 조건을 만족하는 매개변수 조합은 무수히 많다.

 

nand_gate.py

# coding: utf-8
import numpy as np


def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = NAND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

 

1.3 OR 게이트

                                                         [OR 게이트 진리표]

 

입력 신호 중 하나 이상이 1이면 출력이 1이 되는 논리 회로

Ex) 0.5*x1+0.5*x2 > 0.3
       0.5*x1+0.5*x2 > 0.4

 

OR게이트 조건을 만족하는 매개변수 조합은 무수히 많다.

 

or_gate.py

# coding: utf-8
import numpy as np


def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = OR(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

 

※ 퍼셉트론의 매개변수 값을 정하는 것은 컴퓨터가 아니라 사람이 하는 것이다. 사람이 직접 진리표라는 '학습 데이터'를 보면서 매개변수의 값을 생각했다. 기계학습 문제는 이 매개변수의 값을 정하는 작업을 컴퓨터가 자동으로 하도록 한다. 학습이란 적절한 매개변수 값을 정하는 작업이며, 사람은 퍼셉트론의 구조(모델)를 고민하고 컴퓨터에 학습할 데이터를 주는 일을 한다.

 

1.4 XOR 게이트

                                                         [XOR 게이트 진리표]

 

 

                  [OR 게이트]                                             [XOR 게이트]

 

 OR게이트는 0을 원(○)으로 1을 삼각형(△)으로 나타낸 네 점을 직선으로 나누는데 문제가 없다. 하지만 XOR 게이트는 원과 삼각형을 직선으로 나누는 영역을 만드는것이 불가능하다.

 

1.5 선형과 비선형

직선하나로는 원과 삼각형을 나눌 수 없다. 하지만 '직선'이라는 제약을 없앤다면 가능하다. 퍼셉트론은 직선하나로 나눈 영역만 표시할 수 있다는 한계가 있다. 곡선을 표현 할 수 없다는 말이다. 곡선의 영역을 비선형 영역, 직선의 영역을 선형 영역이라고 한다.

 

 

1969년에 Marvin Minsky 교수가, 이 문제를 해결 하는 방법으로 Perceptron을 다중으로 겹치면 이 문제를 해결할 수 있음을 증명하였다.

 

 

2. 다층퍼셉트론

퍼셉트론으로는 XOR게이트를 표현할 수 없다. 퍼셉트론의 장점은 층을 쌓아 "다층 퍼셉트론(Multi-Layer Perceptron)"을 만들 수 있다.

 

 

2.1 기존 게이트 조합하기

XOR 게이트를 만드는 방법은 다양하며, 그중 AND, NAND, OR 게이트를 조합하는 방법이 있다.

 

 

AND, NAND, OR 게이트를 조합해 구현한 XOR 게이트

x1과 x2는  NAND와 OR 게이트의 입력이 되고, NAND와 OR의 출력이 AND 게이트의 입력으로 이어진다.

논리회로(NAND Gate)로 만든 XOR와 퍼셉트론으로 만든 XOR함수의 관계는?

- Multi-Layer (Cascaded)

 Multi-Layer Perceptron이 갖는 장점?

- 비선형성!

 

2.2 조합한 XOR 게이트

 

xor_gate.py

# coding: utf-8
from and_gate import AND
from or_gate import OR
from nand_gate import NAND


def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = XOR(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

 

XOR게이트의 퍼셉트론

 

 

a. 0층의 듀 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보낸다.

b. 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 이 입력 신호를 바탕으로 y를 출력한다.

 

 

3. 정리

- 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.

- 퍼셉트론에서는 '가중치'와 '편향'을 매개변수로 설정한다.

- 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.

- XOR게이트는 단츤 퍼셉트론으로 표현할 수 없다.

- 2층 퍼셉트론을 이용하면 XOR게이트를 표현할 수 있다.

- 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.

- 다층 퍼셉트론은 (이론상) 컴퓨터를 표현 할 수 있다.

 

Github: https://github.com/hwauni/MachineLearning/tree/master/ML_alg/Perceptron

 

- 밑바닥부터 시작하는 딥러닝 -

 

'머신러닝&딥러닝 > 알고리즘' 카테고리의 다른 글

계단 함수(Step Function)  (0) 2017.12.18
인공 신경망  (0) 2017.12.18
Posted by 이성윤