Google Cloud Platform STT API 활용 방법

Google Cloud Platform STT API 활용 방법

AI/STT 2020. 10. 28. 20:55
STT는 Speech To Text로 음성을 텍스트화하는 기술입니다.

Google Cloud Platform에는 이러한 기능의 API를 제공하고 있어 쉽게 활용할 수 있습니다.

1. Google Cloud Platform 가입

https://console.cloud.google.com

Google Cloud Platform

하나의 계정으로 모든 Google 서비스를 Google Cloud Platform을 사용하려면 로그인하세요.

accounts.google.com

새 프로젝트 생성 및 billing account 등록

검색창에서 Cloud Speech-to-Text API 입력 후 ENABLE 클릭

메뉴바에서 사용자 인증 정보 > 사용자 인증 정보 만들기> 서비스 계정 선택

서비스 계정 만들기

역할 선택 > 소유자 > 계속

+키 만들기> JSON 선택

비공개 키 speechtotext-.................json 파일 내 컴퓨터에 자동 저장

다운로드 폴더 내 파일 접근

cmd 창 열기, 아래 명령어 입력

> set GOOGLE_APPLICATION_CREDENTIALS={json파일 위치}\{프로젝트 명}-.................json

*cmd 창 닫으면 다음 번 실행 시 다시 설정해주어야 하므로,

매번 입력하기 번거롭다면 환경 변수 시스템 변수에 등록하기

2 Cloud SDK, Visual Studio C++ 설치

Cloud SDK 설치

https://cloud.google.com/sdk

Cloud SDK 명령줄 도구 | Cloud SDK: 명령줄 인터페이스 | Google Cloud

Cloud SDK는 Google Cloud에서의 개발을 위한 도구 모음으로 gcloud, gsutil, bq 명령줄 도구, 클라이언트 라이브러리, 로컬 에뮬레이터가 포함되어 있습니다.

cloud.google.com

시작 버튼> 왼족 메뉴 바 빠른시작 windows> Google Cloud SDK 설치 프로그램 다운

자동 cmd 창 생성> y 입력> 접근 허용> 다시 cmd 창에서 사용할 프로젝트 번호 입력

Visual Studio C++설치

https://support.microsoft.com/ko-kr/help/2977003/the-latest-supported-visual-c-downloads

https://support.microsoft.com/ko-kr/help/2977003/the-latest-supported-visual-c-downloads

쿠키가 사용되고 있지 않습니다. 쿠키를 사용하고 페이지를 새로 고치세요.

support.microsoft.com

x86 다운로드 후 설치

3. 가상환경 설정

아나콘다 Prompt 창에서 실행

> pip install virtualenv

> pip install virtualenvwrapper-win

프로젝트 폴더 생성

> mkdir STT

> cd STT

가상환경 생성 및 라이브러리 설치

virtualenv {가상환경이름} => 가상환경 위한 도구들 install

> virtualenv env

> .\env\Scripts\activate

=> 경로 앞에 (env) 생성 확인

가상환경 나가고 싶다면,

> deactivate

4. 라이브러리 및 패키지 설치

Google Cloud Client Library for Python 설치

> pip install --upgrade google-cloud-storage

Cloud Speech API Client Library 설치

> pip install google-cloud-speech

서비스 계정 활성화

> gcloud auth activate-service-account --key-file="json파일 위치"

마이크 사용 위한 패키기 설치

> pip install pyaudio

5. 음성인식 실행

findface.netlify.app/

얼굴로 나라찾기!

내얼굴은 어느나라사람과 비슷할까?

findface.netlify.app

접속 후 상단 STT 예제코드 클릭> 다운로드> 프로젝트 폴더에 저장

https://github.com/googleapis/python-speech/blob/master/samples/microphone/transcribe_streaming_mic.py

googleapis/python-speech

Contribute to googleapis/python-speech development by creating an account on GitHub.

github.com

위 링크 참고해서 stt_test1.py에 있는 enum, type 검색 후 => speech로 수정하기

실시간 음성 인식

> python stt_test1.py

=> 음성 인식 확인하기

.wav 확장자의 녹음 파일 텍스트화 실행

> python sound_recorder.py

=> 녹음 후 현재 폴더에 file.wav 파일 생성

> python quickstart.py

혹은

> python stt_test2.py

실행 후 음성 인식 확인하기

이상 오늘의 삽질 일기를 마칩니다:)

여기저기 삽질도 해보고

날려도 먹으면서

배우는 게

결국 남는거다

- Z.Sabziller

쫄보의삽질' 블로그 탄생스토리가 궁금하다면:

Git push 취소 방법 (feat. '쫄보의삽질' 블로그 탄생 배경)

아래는 저의 생생한 경험담을 바탕으로 작성한 것 입니다. Github 관리 폴더의 이름을 실수로 변경하고 삭제해버렸다. 작업 후 commit 하려고 아무리 찾아봐도 폴더가 보이지 않았다. 나의 피땀눈물

ninano1109.tistory.com
저작자표시
댓글

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

인기포스트

ABOUT ME

쫄보의삽질 블로그 쫄보의삽질 블로그

1. Google Cloud Platform 가입

2 Cloud SDK, Visual Studio C++ 설치

3. 가상환경 설정

4. 라이브러리 및 패키지 설치

5. 음성인식 실행

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역