не міг зрозуміти, чому зук заплатив 15 мільярдів доларів за 15 співробітників з scaleAI (даних компанії)
тож я глибоко занурився і, здається, зрозумів це:
Ми не втрачаємо дані. Насправді все навпаки.
один автономний автомобіль виробляє 2ТБ (, це 800 000 книг ) даних ЩО ГОДИНИ.
проблема в тому, що дані в безладі, їх важко ввести в LLM для навчання, тому їх просто кидають у кладовище даних, щоб хтось інший вирішив (ніхто цього не робить).
Серйозна нестача хороших дата-інженерів
Те кладовище, про яке я згадував вище, насправді є золотою копальнею, якщо ви зможете його перебрати.
проблема в тому, що дуже мало людей мають розум чи час. Гадаю, це причина, чому зукі заплатив $15B за працівників scaleAI
Вища якість даних значно цінніша, ніж «кількість» даних.
Особливо для моделей після навчання (eg обчислення часу тестування).
це також вимагає менше обчислень, що знижує витрати на навчання моделей.
отже, якщо ваша команда з навчання може 1. Сортувати високоякісні дані 2. Впроваджувати їх після навчання і 3. Знижувати витрати - ви виграєте в гонці штучного інтелекту (безцінно).
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
не міг зрозуміти, чому зук заплатив 15 мільярдів доларів за 15 співробітників з scaleAI (даних компанії)
тож я глибоко занурився і, здається, зрозумів це:
Ми не втрачаємо дані. Насправді все навпаки.
один автономний автомобіль виробляє 2ТБ (, це 800 000 книг ) даних ЩО ГОДИНИ.
проблема в тому, що дані в безладі, їх важко ввести в LLM для навчання, тому їх просто кидають у кладовище даних, щоб хтось інший вирішив (ніхто цього не робить).
Серйозна нестача хороших дата-інженерів
Те кладовище, про яке я згадував вище, насправді є золотою копальнею, якщо ви зможете його перебрати.
проблема в тому, що дуже мало людей мають розум чи час. Гадаю, це причина, чому зукі заплатив $15B за працівників scaleAI
Вища якість даних значно цінніша, ніж «кількість» даних.
Особливо для моделей після навчання (eg обчислення часу тестування).
це також вимагає менше обчислень, що знижує витрати на навчання моделей.
отже, якщо ваша команда з навчання може 1. Сортувати високоякісні дані 2. Впроваджувати їх після навчання і 3. Знижувати витрати - ви виграєте в гонці штучного інтелекту (безцінно).