슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut)...

29
SKT 인공지능 응용 서비스 2017.6.27 강봉주([email protected])

Transcript of 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut)...

Page 1: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

SKT 인공지능 응용 서비스

2017.6.27

강봉주([email protected])

Page 2: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

1

목차

I. 개요

II. 음성/언어이해 응용 서비스

III. 영상인식 응용 서비스

IV. 자율주행 응용 서비스

V. 빅데이터 분석 솔루션

Contents

Page 3: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

2

I. 개요

4차 산업혁명 시대는 Intelligence 기술의 혁명이 그 핵심이 될 것이며, 주요 Intelligence 응용 기술은 이미 상용화 및 Pilot 단계에 도달하였음

Page 4: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

3

I. 개요

Intelligence 시대는 SK 그룹에 있어 큰 기회이자 위기가 될 것으로 인식, 기존 산업의 Value Chain을 AI 중심으로 근본적으로 재정의해 나갈 것임

Page 5: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

4

Industry 4.0을 맞아 SKT가 보유한 네트워크, 서비스, 유통망 등의 강점들을 AI사업의 인프라로 재정의하고 New ICT 기업으로 변화하고자 함

I. 개요

Page 6: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

5

II. 음성/언어이해 응용 서비스

음성인식 UX에 대한 Needs와 AI엔진 자체 기술의 고도화로 구현된 AI Platform을 통해 고객들에게 차별화된 Value를 제공하고자 함

Page 7: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

6

II. 음성/언어이해 응용 서비스

SKT의 AI 사업의 첫걸음인 음성인식 기반 인공지능 서비스 NUGU는 16년 9월 국내 최초로 출시 되었으며, 소비자, 전문가, 개발자와의 끊임없는 커뮤니케이션으로 국내 AI시장을 선도하고 있음

Page 8: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

7

’15. 3月 Smart Box I Prototype

’15. 8月 Smart Box II Prototype

’16. 9月 NUGU 스피커 상용화

Voice UX의 경험 극대화를 위한 별도 Device 채택

II. 음성/언어이해 응용 서비스

Page 9: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

8

Voice UI는 감성적 전달력과 컨텐츠 직접 접근(Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해 기반 등의 중의성(Ambiguity)을 고려한 서비스 디자인이 필요함

논리적

객관성/정확성

정형적

다양성

제한된 Device적용

Machine

Touch

감성적

맥락연관성

예측불가

Curated

다양한 Device 적용

Human

Voice

[ Voice UX의 특징 ]

UX(User eXperience)를 고려한 디자인 필요

II. 음성/언어이해 응용 서비스

40단어/1분 150단어/1분

Page 10: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

9

Voice Character Who is Saying

Tone & Manner How it is Said

Script What the Voice is

Saying

1 : Voice User Interface Design (Cohen, Giangola, Balogh, 2004)

캐릭터 이미지(Persona)는 3가지 Factor와 그들간의 유기적인 결합(Cohesiveness)에 의해 형성됨

II. 음성/언어이해 응용 서비스

Page 11: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

10

II. 음성/언어이해 응용 서비스

AI Platform은 Natural UI, Intelligence, Service Logic로 구성되어 있고, Machine Learning 기반으로 음성인식, 언어이해 등 AI 엔진을 학습함

Page 12: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

11

II. 음성/언어이해 응용 서비스

NUGU Service Flow

Page 13: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

12

II. 음성/언어이해 응용 서비스

Page 14: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

13

II. 음성/언어이해 응용 서비스

[ 글로벌 음성인식 스피커 시장 전망]

(자료: Gartner, 메리츠종금증권 리서치 센터)

[ 미국 음성인식 스피커 판매량 추이 및 전망]

(자료: VoiceLabs, 메리츠종금증권 리서치 센터)

출처: 사물인터넷의 핵심, 음성인식 스피커(Meritz Research, 2017.3.15)

Page 15: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

14

II. 음성/언어이해 응용 서비스

스마트 스피커 사용 용도 조사(`17.5.30) - 스마트 스피커 소유자의 11%만 물건을 주문하더라도 아마존 등의 글로벌 IT 기업들은 충분히 이득을 취할 수 있을 것으로 전망

※ 다양한 수익모델(BM) 시도 필요: Commerce(쇼핑), Subscribe(구독), 제휴(자동차, 가전 등)

Page 16: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

15

II. 음성/언어이해 응용 서비스

Page 17: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

16

II. 음성/언어이해 응용 서비스

Page 18: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

17

III. 영상인식 응용 서비스

얼굴인식 기술은 사용자의 생체(얼굴)정보를 인식하여 사용자를 인증하는 기술로 개인화 서비스에 활용 가능함

Facial Landmark

Detection

Pose / 조명

Normalization

Feature

Extraction Classification

사용자 인증을 통한 개인화 서비스 활용 예시

– 개인의 사용 패턴을 해석하여 그에 맞는 서비스 추천

(예, 추천 음악, 추천 영화 등)

– 사용자 인증을 통한 출입 제어, 시스템 제어 등 응용에 활용

(예, 기 등록한 사용자 인식 시 보안해제 등)

Page 19: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

18

III. 영상인식 응용 서비스

얼굴 검출 적용 후 검출된 사람의 얼굴이 어느 방향을 보고 있는지 추정하는 기술로 사람과 Device간 Interaction 혹은 사람 간 Interaction 응용 시나리오에 적용 가능

Page 20: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

19

III. 영상인식 응용 서비스

핵심 요소기술 고도화와 더불어, 향후 3rd Party 및 타 산업 파트너들과 협업하여 AI 플랫폼 생태계를 구축하고자 함

Page 21: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

20

IV. 자율 주행 응용 서비스

BMW와 자율주행차 시연(`16.11.15)

출처: SKT-BMW, 세계 최초 ‘5G 커넥티드카’ 시동(보도자료, 2016.11.15)

Page 22: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

21

IV. 자율 주행 응용 서비스

Page 23: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

22

IV. 자율 주행 응용 서비스

Page 24: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

23

IV. 자율 주행 응용 서비스

엔비디아와 자율주행 분야 전략적 협약(`17.5.16)

Page 25: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

24

V. 빅데이터 분석 솔루션 - 메타트론

Page 26: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

25 <Real-time prediction system>

Result Storage

<Data Scientist>

Model Server ...

Load Model

Trained models

Raw Input Storage

<User interface>

V. 빅데이터 분석 솔루션(메타트론) – System 구성

Page 27: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

26

Deep Learning 기반으로 장비의 Health state을 모니터링하고 고장 징후를 예측하는 Predictive Maintenance 솔루션으로, 운행 이력이 누적될 수록 더 정확한 예측이 가능

High precision of “Failure prediction”

- Deep learning 기술과 Physics of failure

knowledge 를 활용한 높은 예측 정확도

Scalability

- 다른 장비로의 확장이 용이함

- Big Data system을 기반으로 하여, massive

data 처리 가능

Maintainability

- 새로 유입되는 데이터에 대한 지속적인

학습 및 모델 업데이트를 통한 안정성 보장

※ 주요 Reference

- SKE PdM : Deep Learning을 활용한 원심압축기 예지정비 솔루션 개발(’17년)

- SK E&S PoC(‘16년)

V. 빅데이터 분석 솔루션(메타트론) – PdM 개요

Page 28: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

27

Predictive Maintenance

정상 운행 데이터(1년 6개월, 1분 단위, 60개 sensor time-series) 를 가지고,

Time-series anomaly detection based on Auto-regressive RNN 을 통해 비정상 운행 패턴을 감지

3일전, 2시간 이상 연속된 알람 실제 사고 지점

정상패턴 학습을 통해 설정된 임계치

3일 전

Ano

mar

lity

scor

e

Time

V. 빅데이터 분석 솔루션(메타트론) – PdM 개요

Page 29: 슬라이드 1B0%AD%BA...8 Voice UI 는 감성적 전달력과 컨텐츠 직접 접근 (Shortcut) 등 편의성이 높으나, 다양한 발화를 통한 예측 불가, Context 이해

28

mean & std.

...

W U U

W U

s s s s

CNN

RNN

...

CNN

RNN

CNN

RNN

y1

y2

y3

ym

...

CRNN1 CRNN2 CRNN3

y1

y2

y3

ym

...

y1

y2

y3

ym

...

Raise an alarm if the measurement(X) deviates

large from confidence bands obtained from mean(μ) and

std(σ)

Sliding window

x1

x2

x3

xm

... X

μ σ

prediction delay (F)

An ensemble of N neural networks

V. 빅데이터 분석 솔루션(메타트론) – Anomaly Detection using Deep Learning