【音声】OKNロイド制作日記ver0.1【c++】
OKNロイドについて
バージョンアップをかますことにした
スポンサードリンク
何が変わったの?
変更点その1
いままでは
a,i,u,e,o
しか音を基本的には出せなかったので出せる言葉をaからho
までついかした
変更点その2
いままでは音声データを自力でトリミングしていたのだが
プログラムで自動でトリミングしてもらえるようにした
あいうえおかきくけこさしすせそたちつてと pic.twitter.com/cZhbpclIu6
— sekibotbot (@sekibotbot) February 14, 2016
初心者がとったいろんな対策などはこちら
【c++】OKNロイド制作日記 ver0.0 - sekibotbotのブログ
c++ カテゴリーの記事一覧 - sekibotbotのブログ
音声 カテゴリーの記事一覧 - sekibotbotのブログ
OKNロイド カテゴリーの記事一覧 - sekibotbotのブログ
↑スポンサードリンク
どんなふうにつくったか
音の追加はそのまんま追加するのでべつにたいしたことない
トリミングするプログラムについてはちょっと疲れた
トリミングのアイデア
持っている音声データをみてみると
こんなかんじになっていた
この画像の矢印のところまでを消去したくて考えていたのだが,
手元にある音声データを見比べてみると,
データの絶対値にだいたい10倍の差があった.
この差をもっと拡大してその差が明らかに大きいところを境界線としたっていう感じ
例
データが
0
0
0
0.01
境界線
0.1
0.2
0.3
0.4
...
という感じ
境界線の上では例えば10倍して5乗したら0か小数になるが
境界線の下では10倍して5乗すると1以上にはなるという感じ
模索はつづく...