zuckがscaleAIから15人の従業員を取得するために150億ドルを支払った理由を理解できなかった(データ会社)
だから、私は深く掘り下げて、これを理解したと思います:
データが不足しているわけではありません。実際にはその逆です。
自動運転車は1台あたり、1時間に2TBのデータ(を生成します。それは800,000冊の本)に相当します。
問題はデータが混乱していて、LLMにフィードするのが容易ではないため、それは誰かが解決するためのデータの墓場に投げ込まれてしまうことです(誰もやらない)。
優れたデータエンジニアの深刻な不足
上で言及したその墓地は、実際にはそれを整理できれば金鉱です。
問題は、非常に少数の人々が頭脳や時間を持っていることです。これが、ザッカーバーグがScaleAIの従業員に150億ドルを支払った理由だと推測します。
より高品質なデータは「量」のデータよりもはるかに価値があります
特に、トレーニング後のモデル (eg テスト時間の計算 ).
それはまた、モデルのトレーニングコストを削減するために、より少ない計算を必要とします。
したがって、もしあなたのトレーニングチームが 1. 高品質のデータを整理し 2. トレーニング後にそれを注入し 3. コストを削減できれば - あなたはAIレースに勝つことができる (priceless)。
原文表示