マルチメディアフレームワーク「FFmpeg」のバージョン7.0(コードネーム:Dijkstra)が2024年4月5日に公開されました。FFmpeg 7.0では「ネイティブVVCデコーダーの追加」「IAMFのサポート」「CLIツールのマルチスレッド化」「非推奨APIの削除」といった変更が加わっています。 FFmpeg https://ffmpeg.org/#pr7.0 ????FFmpe...
こんにちは、ニケです。 色々あって最近 Open Interpreter のDiscordサーバーのMODになりました。 今回はその Open Interpreter から新しいオープンソースプロジェクトである「01」が発表されたので紹介したいと思います。 01 とは?Open Interpreterが搭載されたオープンソースプロジェクトで、2024年3月21日に発表され...
はじめに みなさんは動画編集をやったことはありますか? 私は,頻度は低いものの動画編集をして動画投稿サイトに動画をアップロードした経験があります. 動画編集とは元来めんどくさく手間がかかるものではあるのですが,普段からWebアプリの開発をしている私は,以下のようなことを考えていました. HTML/CSSのように...
音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた はじめに 2024年2月14日に、ReazonSpeechの最新バージョン v2.0が公開されたため、ReazonSpeech音声認識モデルを利用してみました。 ReazonSpeechは、レアゾン・ヒューマンインタラクション研究所が開発した高精度な音声...
日本での発売開始 日本国内で電波を正しく使うための法律(技適)の都合により世界販売から遅れて販売開始されることが多く、今回は3ヶ月ほど遅れての発売となりました。 電源に注意 Pi4までの 5V 3A でも動作させることができますが、ピークパフォーマンスを発揮させるためには 5V 5A という若干特殊な電源が必要になり...
音声データをPythonで取り込んで表示したり解析したりしたいと思ったことはありませんか? この記事では音声データの入出力をPythonで行えるpydubのインストールと基本的な使用方法(音声データの読み込み)について説明します。 pydubで音声データファイルの入力ができれば,Numpyが提供する関数等を使用してPython上で...
by Jillian Northrup Unity Technologiesが開発するゲームエンジン「Unity」では、「アセット」と呼ばれる、ゲーム制作に使用できる数多くのツールが提供されています。2019年からUnityにおいて「VLC for Unity」というアセットの配布を行っていた開発者のマーティン・フィンケル氏が、Unityのパブリッシャーアカウント...
はじめに 本記事では、議事録作成の自動化を目的としてOpenAIのChatGPTとWhisperのAPIを組み合わせたワークフローを紹介します。このワークフローでは、まず会議の録音データをWhisperで文字起こしし、その後、ChatGPTを用いて要約を行います。 使用したコードはこちらで共有しています:GitHubリポジトリ ワークフロー ...
「Google Colab」で「Stable Zero123」を試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Stable Zero123「Stable Zero123」は、「Zero123」に基づく単一画像からの高品質3Dオブジェクト生成のモデルです。改善されたデータレンダリングとモデルコンディショニング戦略により...
「ffmpeg」に関連する商品は見つかりませんでした