zuck'un scaleAI ( veri şirketinden 15 çalışanı almak için neden 15 milyar dolar ödediğini anlayamadım )
derinlemesine araştırdım ve sanırım çözdüm:
Veri bitmiyor. Aslında tam tersi.
tek bir otonom araç saatte 2TB ( veri üretiyor, bu da 800.000 kitap) eder.
sorun, verilerin karmaşık olması ve bunları bir LLM'ye beslemenin kolay olmaması; bu yüzden sadece başka birinin çözmesi için bir veri mezarlığına atılıyor (hiç kimse yapmıyor).
İyi veri mühendislerinin ciddi kıtlığı
Yukarıda bahsettiğim o mezarlık, eğer içinden geçebilirseniz aslında bir altın madeni.
sorun, çok az insanın beyni veya zamanı olması. Sanırım bu yüzden zuck, scaleAI çalışanlarına 15 milyar dolar ödedi.
Daha yüksek kaliteli veriler, verinin "miktarı"ndan çok daha değerlidir.
Özellikle eğitim sonrası modeller (eg test zamanı hesaplama).
bu aynı zamanda daha az hesaplama gerektirir, bu da modellerin eğitimi için maliyeti düşürür.
Eğer eğitim ekibiniz 1. Yüksek kaliteli verileri sıralayabiliyorsa 2. Bunları eğitim sonrası enjekte edebiliyorsa ve 3. Maliyetleri azaltabiliyorsa - yapay zeka yarışını kazanacaksınız (priceless).
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
zuck'un scaleAI ( veri şirketinden 15 çalışanı almak için neden 15 milyar dolar ödediğini anlayamadım )
derinlemesine araştırdım ve sanırım çözdüm:
Veri bitmiyor. Aslında tam tersi.
tek bir otonom araç saatte 2TB ( veri üretiyor, bu da 800.000 kitap) eder.
sorun, verilerin karmaşık olması ve bunları bir LLM'ye beslemenin kolay olmaması; bu yüzden sadece başka birinin çözmesi için bir veri mezarlığına atılıyor (hiç kimse yapmıyor).
İyi veri mühendislerinin ciddi kıtlığı
Yukarıda bahsettiğim o mezarlık, eğer içinden geçebilirseniz aslında bir altın madeni.
sorun, çok az insanın beyni veya zamanı olması. Sanırım bu yüzden zuck, scaleAI çalışanlarına 15 milyar dolar ödedi.
Daha yüksek kaliteli veriler, verinin "miktarı"ndan çok daha değerlidir.
Özellikle eğitim sonrası modeller (eg test zamanı hesaplama).
bu aynı zamanda daha az hesaplama gerektirir, bu da modellerin eğitimi için maliyeti düşürür.
Eğer eğitim ekibiniz 1. Yüksek kaliteli verileri sıralayabiliyorsa 2. Bunları eğitim sonrası enjekte edebiliyorsa ve 3. Maliyetleri azaltabiliyorsa - yapay zeka yarışını kazanacaksınız (priceless).