Perplexity AIの対話モードで日本語音声入力を認識しなくなったときの対処方法
Perplexity AIの対話モードはとても便利です。ただ、その音声入力で突然、日本語音声が認識しなくなりました。その対処方法を見つけましたので、紹介します。これで、日本語音声入力を認識しなくなったPerplexity AIと対話モードで会話することができるようになります。
※本サイトは記事内にプロモーションを含む場合があります
Perplexity AIの対話モードはとても便利です。ただ、その音声入力で突然、日本語音声が認識しなくなりました。その対処方法を見つけましたので、紹介します。これで、日本語音声入力を認識しなくなったPerplexity AIと対話モードで会話することができるようになります。
アップルポッドキャストは自動で文字起こしをしてくれますが、それをブログに使うなど二次利用するときには面倒です。オトナルが音声を文字起こしできるサマリーFMというツールを公開してくれていますので、それを使いやすくするブックマークレットを作りました。アップルポッドキャスト→ブックマークレット→サマリーFM→文字起こし完了!→noteなどブログに貼り付け、といった作業がすぐにできます。
作曲AIのSunoの利用規約を、ChatGPTを使って日本語訳してみました。権利に関しては、やはりAIに関しての著作権処理は世界各国で流動的ですので、難しいところですね。ただ、Suno、ほんと凄いですね。
プレゼント企画は、エックス(旧Twitter)のフォロワーを増やしたり、露出を増やしたりする定番のプロモーションです。ただ、応募数が多ければ多いほど、その当選処理が煩雑になります。私はこれまでその作業を、なるべく主観が入らないようにプログラムを組んである程度は自動化していましたが、それでもそれなりの工数がかかっていました。しかし、ChatGPTを使えばものの数秒で終わります。作ったプログラムはお払い箱になってしまいましたが、無料版ChatGPTでも出来ますので、みなさんもぜひ。
Chat-GPTとおしゃべりしている様子をstand.fmというライブ配信アプリで配信したくて、接続をしてみました。このときわかったのですが、BRIDGE CASTのAUX入力ですが、USBからは出力されないのですね。USBとライブ配信アプリへスマホ接続しましたが、AUXはレベルメーターが反応し、モニタイヤホンからもちゃんとマイクとミックスされて聴こえているのですが、USBからスマホへは、マイクしか出力されていませんでした。STREAM MIXやMOBILE切り替えなどいろいろ試しましたが、音がでませんでした。BRIDGE CASTのAUXをLINEOUT出力して音を出す方法、スマホへ配信、する方法をご紹介します。
AI合成音声は、多くの文章を学習させなめらかな音声を実現します。ですので、英語で話せるAIキャラクターは思いのほか少ないのが現状です(ソングですと少しは増えます)。AI合成音声で、英語を話せるキャラクターをご紹介します。利用範囲については、それぞれの利用規約を参照してくださいね。
まさに自動サクラ機能ともいうべき、歓迎すべき新しい流れ。国内音声ライブアプリのRadiotalkが、AIによる自動コメント機能の実験を2023年5月5日限定で行い、大いに盛り上がりを見せていました。
自分以外のstand.fmの収録配信を、サマリーFMをつかって、手軽に文字起こしできるPCブラウザ向けブックマークレットの更新です。
スタンドエフエムという音声配信アプリは、PCブラウザでも配信ページを開け、音声を聴くことができます。その音声を文字起こしする便利な方法をご紹介します。
AIの活用の広がりが止まりませんね。インターネットが爆発的に増えたときや、Clubhouseのブームを彷彿しますね。ただこの勢いはまだまだ増えそうな気はしています。インターネットのように、情報処理のインフラになりそうなくらいに見ています。そんなおり、いろいろと考えることがあったので、備忘録的にまとめます。ちょっとでも共感してくれたらシェアしてご意見くださいませ。
noteのAIアシスタント機能に招待されましたので早速使ってみました。たしかにちょっとしたアイデア出しや文章の校正などに使えそうです。大量の処理はChatGPT、ちょっとしたことであればnoteと、使い方も広がりそうです。
Webブラウザでユーザー登録もなく、無料で使える凄いAI自動作曲サービスがあります。コード進行や歌詞を入力しますと、なんと合成音声のボーカルまで挿入してくれます。作った曲はパブリックドメインで自由に使える「CREEVO」をご紹介します。
音声配信やプレゼンやスピーチなどで、つい言ってしまう「えー」「あー」などのフィラー。私は音声配信でこれらのフィラーをカットして編集して投稿をしています。今回、AI文字起こしツールを使って、フィラーをどれくらい自分がしゃべってしまっているのか調べました。けっこうしゃべってますね。フィラーを無くす方法は声を大きくすることです。
HyperLogLog++(ハイパーログログプラスプラス)というGoogleのアルゴリズムがあります。これは、Googleが提供するアクセス解析ツールであるGA4の推定アルゴリズムなのだそうです。何を推定するのかというと、設置したウェブサイトのアクセス数などを推定するとのこと。実は、GA4でレポート表示されるデータは、サンプリング(データが膨大なとき、処理を軽くするため、データを統計的に問題ない範囲で間引いて軽くする処理)をされずとも、そもそも推定データなのだそうです。
Adobeがポッドキャスター向けのサービスを準備しています。2021年からProject Shastaとして進められてきたものですが、今回はベータ版ということで、AIによる音声向上をさせる「Enhance speech」機能と、マイクのテスト「Mic Check」機能が公開されましたので、早速試してみました。
ポッドキャストの文字起こしに、LINEのCLOVA Noteが凄いです。無料で月に300分まで使えて、精度・スピード・価格、すべてにおいて完璧です。とくにスピードが凄くて、73分のインタビューを1分かからず、ポッドキャストをかなりの精度で文字起こししました。
音声認識は精度があがってきて、日本語でもかなりの変換効率になってきました。そして、音声ファイルからの文字起こしも精度があがってきて、今回LINEも参入してきましのたで試しました。
YouTubeのAIによる自動判定の誤動作にひっかかってしまいました。再審査で解除はされましたが、学習が進むまではこうした手間が増えると思うと、やれやれという気持ちです。
YouTubeでのチャンネル登録が2000人を超えましたので、自分用にもここで知見をまとめたいと思います。ユーチューブ、ほんと楽しいです。