Eu acho que muitas pessoas interpretam errado o thinking e o modo normal, acreditando que o thinking é sempre melhor, mas na verdade não é. O modo normal é treinado com base em corpora, enquanto o thinking é adicionado com RL, portanto, escolher diferentes modos para diferentes tarefas é o correto.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
15 gostos
Recompensa
15
3
Republicar
Partilhar
Comentar
0/400
StakeTillRetire
· 16h atrás
O que mais odeio são superstições de moda.
Ver originalResponder0
MiningDisasterSurvivor
· 16h atrás
Os idiotas antigos acertaram de novo, o grande modelo só mostra a sua verdadeira face quando é necessário.
Ver originalResponder0
HodlBeliever
· 16h atrás
De acordo com a análise de tendências, a escolha do modelo também deve considerar o ROI.
Eu acho que muitas pessoas interpretam errado o thinking e o modo normal, acreditando que o thinking é sempre melhor, mas na verdade não é. O modo normal é treinado com base em corpora, enquanto o thinking é adicionado com RL, portanto, escolher diferentes modos para diferentes tarefas é o correto.