ピクスタ株式会社(東京都渋谷区代表取締役社長:古俣大介、東証スタンダード:3416)が運営する写真・イラスト・動画・音楽素材のマーケットプレイス「PIXTA(ピクスタ)」は、「機械学習用画像・動画データ提供サービス」として、昨年公開し大きな反響を呼んだ「熊画像データセット」に続き、新たに「熊動画データセット」の販売を開始いたします。昨今の深刻なクマ被害を受け、「静止画だけでなく、動画を用いて歩行パ ...
-生命現象や疾患の転写メカニズム研究の効率化に貢献- 理化学研究所(理研)生命医科学研究センター大容量データ管理技術開発ユニットのイマド・アブケセーサ研究員、野口修平研究員(研究当時)、粕川雄也ユニットリーダーの研究チームは、ヒトや ...
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset*(キュリンデータセット)』において、『日本語・3話者・話者分離・日常会話 ...
AIを構築する上ではアルゴリズムだけでなく訓練用のデータセットも重要であり、データセットの質によってAIの精度も大きく左右されます。高精度な画像生成AIとして話題のStable Diffusionでは、「LAION-5B」という50億以上もの画像とテキストのペアを含む ...
「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。 大学共同利用機関法人情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(CODH)が、 江戸時代に関する空間的 ...
NVIDIAは9月24日、日本の実社会における人口統計、地理的分布、文化的分布に沿ったペルソナを含む初のオープン合成データセット「Nemotron-Personas-Japan」をHugging Face上に公開した。 データセットの特徴と構成 同社では、高性能かつオープンなモデルファミリー ...
ハーバード大学は12月12日(米国時間)、約100万冊のパブリックドメインの書籍を含む高品質なデータセットを公開すると発表した。このデータセットは、ハーバード大学がマイクロソフトおよびOpenAIからの資金提供を受けて新設したInstitutional Data Initiative ...
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について ...
用途: 企業特化モデルを作成する時のベースモデル。このモデルに事後学習を実施することで、精度高く目的の特化モデルを作成可能。 特徴: Alibaba社のQwen2.5-32B-instuctをベースに、高品質な日本語データセットで継続事前学習を実施。Chatvectorにより、指示 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する