株式会社Adansons(本社:宮城県仙台市、以下「Adansons」)は、非構造化データのメタ情報を整理し、AI学習用データセットの作成・管理を容易にするデータマネジメントツール「Adansons Base」をリリースしました。 ウェブサイト(日本語版):https://adansons ...
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、合計7万時間超に及ぶ大規模な「日本語音声データセット」を ...
OpenAIは9日(米国時間)、AIモデルのトレーニングのためのパブリックやプライベートなデータセット作成に向けて各社と協力する取り組み「OpenAI Data Partnerships」を発表した。 AIの進化においては、広範な学習データセットが必要だが、利用可能な大規模な ...
AIを構築する上ではアルゴリズムだけでなく訓練用のデータセットも重要であり、データセットの質によってAIの精度も大きく左右されます。高精度な画像生成AIとして話題のStable Diffusionでは、「LAION-5B」という50億以上もの画像とテキストのペアを含む ...
「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。 大学共同利用機関法人情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(CODH)が、 江戸時代に関する空間的 ...
用途: 企業特化モデルを作成する時のベースモデル。このモデルに事後学習を実施することで、精度高く目的の特化モデルを作成可能。 特徴: Alibaba社のQwen2.5-32B-instuctをベースに、高品質な日本語データセットで継続事前学習を実施。Chatvectorにより、指示 ...
ハーバード大学は12月12日(米国時間)、約100万冊のパブリックドメインの書籍を含む高品質なデータセットを公開すると発表した。このデータセットは、ハーバード大学がマイクロソフトおよびOpenAIからの資金提供を受けて新設したInstitutional Data Initiative ...