não conseguia entender por que o zuck pagou 15B para adquirir 15 funcionários da scaleAI (data company)
então eu mergulhei fundo e acho que descobri:
Não estamos a ficar sem dados. Na verdade, é o oposto.
um único carro autónomo produz 2TB ( que equivale a 800.000 livros ) de dados POR HORA.
o problema é que os dados são uma confusão, não é fácil alimentá-los em um LLM para treinar, então acabam sendo jogados em um cemitério de dados para que alguém mais resolva (ninguém faz ).
Escassez severa de bons engenheiros de dados
Esse cemitério que mencionei acima é na verdade uma mina de ouro se você conseguir classificá-lo.
o problema é que muito poucas pessoas têm a inteligência ou o tempo. Adivinho que é por isso que o zuck pagou 15 mil milhões de dólares pelos empregados da scaleAI
Dados de maior qualidade são muito mais valiosos do que a "quantidade" de dados.
Especialmente para modelos pós-treinamento (eg tempo de computação de teste).
também requer menos computação, o que reduz o custo para treinar modelos.
então, se a sua equipe de treinamento conseguir 1. Classificar dados de alta qualidade 2. Injetá-los no pós-treinamento e 3. Reduzir custos - você vai ganhar a corrida da IA (inestimável).
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
não conseguia entender por que o zuck pagou 15B para adquirir 15 funcionários da scaleAI (data company)
então eu mergulhei fundo e acho que descobri:
Não estamos a ficar sem dados. Na verdade, é o oposto.
um único carro autónomo produz 2TB ( que equivale a 800.000 livros ) de dados POR HORA.
o problema é que os dados são uma confusão, não é fácil alimentá-los em um LLM para treinar, então acabam sendo jogados em um cemitério de dados para que alguém mais resolva (ninguém faz ).
Escassez severa de bons engenheiros de dados
Esse cemitério que mencionei acima é na verdade uma mina de ouro se você conseguir classificá-lo.
o problema é que muito poucas pessoas têm a inteligência ou o tempo. Adivinho que é por isso que o zuck pagou 15 mil milhões de dólares pelos empregados da scaleAI
Dados de maior qualidade são muito mais valiosos do que a "quantidade" de dados.
Especialmente para modelos pós-treinamento (eg tempo de computação de teste).
também requer menos computação, o que reduz o custo para treinar modelos.
então, se a sua equipe de treinamento conseguir 1. Classificar dados de alta qualidade 2. Injetá-los no pós-treinamento e 3. Reduzir custos - você vai ganhar a corrida da IA (inestimável).