모임 개요
- 일시: 2025년 03월 08일 16:30 ~ 19:30
- 장소: 공학관 5층
- 참가자 명단: 전원 참가
- 사진


팀원별 활동 내용
- 김종민
- 공부한 내용:
- AI 및 머신러닝의 기본 개념 정리
- 음성 데이터의 특징 및 음성 변환(TTS, STT) 개요 학습
- 기존 AI 음성 모델(Whisper, Tacotron, WaveNet 등) 조사
- 소감:
- 음성 변환 기술이 단순히 소리를 바꾸는 것이 아니라, 다양한 AI 기술과 결합되어 있다는 점이 흥미로웠습니다. 특히 딥러닝 기반 음성 모델이 어떻게 학습되는지 더 깊이 파고들고 싶어졌습니.
- 김성호
- 공부한 내용:
- 파이썬 및 Jupyter Notebook 환경 설정 및 기본 실습
- 음성 데이터 처리 기본 개념 이해 (샘플링, 스펙트로그램 등)
- 오픈소스 음성 변환 모델 활용 가능성 조사
- 소감:
- 기존에 음성 데이터는 단순한 오디오 파일로만 생각했는데, 샘플링과 스펙트로그램 개념을 배우면서 데이터의 구조를 이해하는 것이 중요하다는 걸 느꼈습니다.
- 정성원
- 공부한 내용:
- 텍스트 기반 음성 변환(TTS) 개념 정리
- STT(Speech-to-Text)와 TTS(Text-to-Speech) 비교
- AI 음성 변환 기술의 실제 활용 사례 조사
- 소감:
- 우리가 자주 사용하는 TTS 서비스들이 어떤 원리로 동작하는지 배울 수 있어서 유익했습니다.
- 박수연
- 공부한 내용:
- 오디오 데이터의 기본 구조 및 전처리 개념 학습
- 음성 변환을 위한 주요 딥러닝 모델 개요 조사
- AI 기반 음성 변환의 한계 및 문제점 탐구
- 소감:
- 음성 데이터를 AI 모델이 어떻게 변환하는지 배우면서, 아직까지 해결해야 할 기술적 과제들이 많다는 걸 깨달았습니다.
- 정찬우
- 공부한 내용:
- 오픈소스 TTS/STT 모델(Whisper, Coqui-TTS 등) 조사
- 음성 데이터의 특징을 분석하는 라이브러리(librosa 등) 탐색
- AI 음성 모델의 학습 과정 이해
- 소감:
- 음성 데이터를 직접 다뤄보지는 않았지만, 이번 학습을 통해 기본적인 개념을 익힐 수 있었습니다.