音声認識 - 関連ブログ

AppleはGoogleから約40人のAI専門家を引き抜いてスイス・チューリッヒに極秘研究所「Vision Lab」を開設している

近年のAppleでは、オープンソースの言語モデル「OpenELM」やマルチモーダル大規模言語モデル「Ferret-UI」などのAI関連製品の開発が精力的に行われています。そんなAppleではGoogleから少なくとも36人ものAI専門家を引き抜き、スイス・チューリッヒにAIモデルや製品を開発する研究所を設立していることが報告されていま...

ストレスフリーで字幕が見られる?「ぴったり字幕」開発の舞台裏|NHK広報局

「あれ、なんか字幕が読みにくいな…」 ガヤガヤと人でにぎわう昼どきの社員食堂。 日替わり定食を食べながらぼんやりとニュースを眺めていたある日、ふと違和感を覚えました。 生放送のニュース番組。すらすらとしゃべるアナウンサーの声に、少し遅れて表示される字幕…。 みなさんはふだん、テレビを字幕付きで見たこと...

英語ができないのに海外赴任が決まった!そんな時どうする? | ロジカル英語ナビ

海外駐在員は英語力のある人が選ばれることが多いですが、中には英語ができないのに海外駐在員に選ばれた!という人もいます。 ただでさえ不測の事態が起こりがちな海外、そこに英語が話せないまま住むことを想像すると、あなたの身の回りに起こることに対応できるのか不安になりますよね。 そこでこの記事では、海外駐...

財務分析・株価予測・稟議書作成… AIプロフェッショナル組織のリーダーが語る、生成AI活用法

ChatGPTは株価予測ができる 森正弥氏:こんな使い方もありますみたいなところで、大企業でもいろいろ進んでいるのは財務分析で、「財務データを入れて分析して」と言うと……ちょっと(スライドの)真ん中の文字が小さくて見えにくいですが、一般的な財務分析をしてくれます。 ちょっとインパクトがあったのが、ChatGPTは...

世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性

世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性 生成AIの衝撃 ~ アジャイルガバナンスの必要性と3ディメンジョン・モデルによる進化へ #1/4 日本は生成AIの活用がとんでもなく進んでいる 森正弥氏:森正弥です。「生成AIの衝撃 アジャイルガバナンスの必要性と...

iOS/macOSオンデバイスで爆速で動作する音声認識モデルWhisperKit - Sansan Tech Blog

iOSエンジニアの堤です。先日3月28日に開催された弊社主催のLTイベントで、「WhisperKitがだいぶ良いので紹介する」というタイトルで発表しました。 スライドはこちら: www.docswell.com 本記事は、同発表をベースとしつつ、(LTでは時間が足りないので)発表ではカットした内容を盛り込んで記事として再構成したものに...

感情に応じてフォントが変化 DNP、音声をリアルタイムでテキスト表示するシステム 窓口での案内などに

大日本印刷(DNP)は4月23日、音声をリアルタイムで文字に変換し、目立たせたい単語を強調して透明スクリーンに表示する「DNP対話支援システム」を発売した。感情などを表す単語について、自動で最適なフォントを選んで表示するする機能が特徴だ。 聴覚障がい者や高齢者など、音声を聞き取ることが困難な人に対応する窓...

日本語音声認識に特化したWhisperである kotoba-whisper-v1.0を早速試してみた | DevelopersIO

はじめに 昨日公開された日本語音声認識に特化した「Kotoba-Whisper」のkotoba-whisper-v1.0を試してみました。 本モデルは、OpenAIの「Whisper large-v3」を教師モデルとして使用し、蒸留(大規模な学習モデルから、同機能を持つより小さなモデルを開発する手法)を用いて開発されました。 kotoba-whisper-v1.0は、Reaz...

GPT-4に日本語特化モデル OpenAI Japan始動会見で発表

米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや...

ONDが届ける「心も通う」インターネットサービスのあり方 - さくマガ

>>5分でさくらインターネットのサービスがわかる!サービス紹介資料をダウンロードする インターネットの発達により、コミュニケーションや情報発信の手段は格段に容易となった現在。ある意味で人と人とのつながりは以前より近づいたともいえるが、その速度や即応性は心理的距離を縮めたとは限らない。心も通わせるイン...


音声認識 - アマゾン検索


「音声認識」に関連する商品は見つかりませんでした

アマゾンから探す