[라즈베리파이 프로젝트] 음성인식(Speech Recognition) 맛보기 - 1. 마이크/스피커 준비하기

메카 2017-11-20 (월) 23:05 7년전 42168

라즈베리파이 프로젝트

음성인식(Speech Recognition) 맛보기 - 1. 마이크/스피커 준비하기

안녕하세요. 메카솔루션 알도입니다.

이번 주에는 라즈베리파이를 이용한 간단한 음성 인식 DIY를 진행해보고자 합니다. 실제 음성 인식 시스템을 바닥부터 만드려면 다양하고 방대한 음성 데이터와 머신 러닝 능력을 갖춘 개발자를 갈아 넣으면(ㅠㅠ) 됩니다. 다행히도 구글과 아마존 같은 대기업에서 이미 편리한 솔루션을 만들어서 비교적 사용하기 편하게 제공하고 있습니다. 먼저 대표적인 음성인식 솔루션으로는 구글의 구글 어시스턴트(Google Assistant)와 스피치(Speech API) 아마존의 알렉사(Alexa)가 있습니다. 셋 다 Python SDK 형태로 제공되기 때문에 처음 데모를 동작시키는 것만 성공한다면 Python만 할 줄 알면 누구나 쉽게 자신만의 음성 인식 장치/프로그램을 만들 수 있습니다

어시스턴트와 알렉사는 영어 밖에 안되지만 무료이며, 스피치는 110개 언어를 지원하지만 현재 12개월만 무료입니다. 단순히 라이브러리만 다운로드 받는 것이 아니라, 다운로드 받은 라이브러리를 구글이나 아마존 계정을 통해야 하기 때문에 설치과정이 복잡하고 어려울 수 있습니다. 그래도 한번 성공하면, 보다 다양한 프로젝트를 할 수 있으니 인내심을 갖고 도전해보시기 바랍니다. 저도 최대한 쉽게, 많은 그림을 넣어서 정리해보겠습니다.

준비물

이번 강좌를 위해서는 다음과 같은 준비물들이 필요합니다.

- 3.5mm 오디오 잭 스피커와 USB 마이크

아직 판매 준비 중입니다. 시중 아무 제품을 사용하셔도 아무 문제 없습니다.

- 라즈베리파이 3

http://mechasolution.com/shop/goods/goods_view.php?goodsno=329559&category=046001

?src=%22http%3A%2F%2Fmechasolution.com%2

라즈베리파이3 B 모델 (RaspberryPi 3 B Model)

리눅스 운영체제 기반으로 작동하는 미니 컴퓨터 '라즈베리파이' 입니다. 라즈베리파이 3 B Model 버전이 새로이 출시되었습니다. 이전 버전에 ...

mechasolution.com

- Micro SD 카드 및 리더

http://mechasolution.com/shop/goods/goods_view.php?goodsno=245833&category=066002

샌디스크 MICROSDHC ULTRA 16GB UHS-I CLASS10 (Sandisk 마...

전자부품/반도체IC 아두이노 라즈베리파이 교육용/DIY키트 MCU 개발보드 센서/감지 모듈/기타부품 모터/드라이버 로봇/드론/RC...

mechasolution.com

http://mechasolution.com/shop/goods/goods_view.php?goodsno=330490&category=132022

마이크로 SD카드 리더기 안드로이드 열쇠고리 / Micro SD Card Reader Android

전자부품/반도체IC 아두이노 라즈베리파이 교육용/DIY키트 MCU 개발보드 센서/감지 모듈/기타부품 모터/드라이버 로봇/드론/RC...

mechasolution.com

- Micro USB 전원

http://mechasolution.com/shop/goods/goods_view.php?goodsno=329709&category=135004

[스피디] MAX2500 5V 2.5A 어댑터,어답터 / 라즈베리파이3, 안드로이드 충전기 / ...

전자부품/반도체IC 아두이노 라즈베리파이 교육용/DIY키트 MCU 개발보드 센서/감지 모듈/기타부품 모터/드라이버 로봇/드론/RC...

mechasolution.com

- WiFi(무선) 또는 이더넷(유선)을 통한 인터넷 연결

라즈베리파이를 시작하는 방법은 크게 4가지가 있습니다. 먼저 운영체제(라즈비안)을 아래 포스트를 참조하여 설치합니다.

http://blog.naver.com/roboholic84/221026914884

?src=%22http%3A%2F%2Fcafefiles.naver.net

[라즈베리파이 기초 강좌]2. 운영체제 설치하기

라즈베리파이 기초 강좌2. 운영체제 설치하기 1. 라즈베리파이 소개 및 구입: http://cafe.naver.com/mandl...

blog.naver.com

운영체제 설치가 완료되면

1. 별도 컴퓨터 없이 라즈베리파이만 이용시

- 모니터/키보드/마우스

2. 시리얼 통신과 WiFi 이용시

- FTDI 시리얼 컨버터와 점프선

http://blog.naver.com/PostThumbnailView.nhn?blogId=roboholic84&logNo=221069408569&categoryNo=44&parentCategoryNo=&from=postList

?src=%22http%3A%2F%2Fblogthumb2.naver.ne

[라즈베리파이 강좌] 모니터 없이 시작하기 - 1. 시리얼 통신을 통한 방법

죄송합니다. 새로운 방법으로 레이아웃을 했는데, 모바일에서는 보기는 불편하실 수 있습니다. 라즈베리파...

blog.naver.com

3. 공유기를 통해 이더넷을 통한 인터넷 연결시

- 공유기, 이더넷 케이블(랜선)

http://blog.naver.com/PostThumbnailView.nhn?blogId=roboholic84&logNo=221069545661&categoryNo=44&parentCategoryNo=&from=postList

[라즈베리파이 강좌] 모니터 없이 시작하기 - 2. 공유기를 통한 방법

죄송합니다. 새로운 방법으로 레이아웃을 했는데, 모바일에서는 보기는 불편하실 수 있습니다. 라즈베리파...

blog.naver.com

4. 데스크탑이나 랩탑을 서버로 이용시

- 이더넷 케이블(랜선)

http://blog.naver.com/PostThumbnailView.nhn?blogId=roboholic84&logNo=221069673907&categoryNo=44&parentCategoryNo=&from=postList

[라즈베리파이 강좌] 모니터 없이 시작하기 - 3. 직접 랜선으로 연결하는 방법

죄송합니다. 새로운 방법으로 레이아웃을 했는데, 모바일에서는 보기는 불편하실 수 있습니다. 라즈베리파...

blog.naver.com

스피커와 마이크 설정하기

이 글은 구글 어시스턴트 홈페이지 내용을 참조하여 작성하였습니다.

https://developers.google.com/assistant/sdk/?authuser=2

Google Assistant SDK | Google Assistant SDK | Google Develop...

The Google Assistant SDK lets you embed the Google Assistant in your devices.

developers.google.com

먼저 라즈비안 업데이트를 진행하겠습니다. 익숙하신 분들은 라즈비안이나 리눅스에서 프로젝트 진행시 필수 사항인 것을 아실 것입니다. 이미지를 새로 만드신 분들은 오래 걸리실 수 있으니 여유를 갖고 진행하시기 바랍니다.

$ sudo apt-get update

$ sudo apt-get upgrade

$ sudo apt-get dist-upgrade

음성 인식 데모를 실행하기 앞서 스피커와 마이크를 설정하고 잘 작동하는지 확인할 필요가 있습니다. USB 마이크를 라즈베리파이의 USB에 연결하고, 스피커를 라즈베리파이의 3.5mm 오디오 잭에 연결해줍니다. 라즈비안의 터미널로 들어가서 다음을 따라하시면 됩니다.

먼저 사용가능한 마이크를 확인합니다.

$ arecord -l

사용가능한 스피커를 확인합니다.

$ aplay -l

arecord -l 명령 뒤에 뜬 것이 마이크(capture hardware) 리스트이고, aplay -l 명령 뒤에 나온 것이 스피커(Playback hardware) 리스트입니다. 먼저 마이크는 card 1에 device 0인것을 기억해 두어야 합니다. 그리고 스피커는 card 0에 device가 0, 1로 2개가 있는데, 0번이 오디오 잭에 연결된 스피커이고, 1번은 HDMI 케이블에 연결되는 스피커입니다. 모니터에 스피커가 내장되어 있고 HDMI 연결을 사용한다면 후에 1번을 선택해서 모니터에 내장된 스피커를 사용할 수 있습니다.

위 내용을 기억하기 어려울 수 있으므로 터미널을 하나 더 띄워서 다음 명령을 입력합니다.

$ nano .asoundrc

마이크는 card 1, device 0에 연결된 것 1개 밖에 없으므로 pcm.mic 부분은 "hw:1,0"로, 스피커는 오디오 잭이 card 0에 device 0, HDMI가 card 0에 device 1입니다. 저는 오디오 잭에 연결된 스피커를 사용하므로 pcm.speaker 부분에 "hw:0,0"으로 하였습니다. 여기서 모니터에 내장된 HDMI 스피커를 사용하실 분은 "hw:0,1"로 하시면 됩니다.

pcm.!default {

type asym

capture.pcm "mic"

playback.pcm "speaker"

}

pcm.mic {

type plug

slave {

pcm "hw:1,0"

}

pcm.speaker {

type plug