確かに、RLを使うことで新しい注文の出現/美しさ/一貫性が得られるのは明らかだと思います。しかし、もちろんそれはあらゆる種類の損害や損失への道も開くのです。


私は、RLがベースモデルよりも「シミュレーション」に優れたモデルを作成できると思います! (エージェント的に自己修正することで)
THINK-2.33%
GET7.11%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 6
  • リポスト
  • 共有
コメント
0/400
AirdropHunterWangvip
· 16時間前
rlの効果は良いですが、危険です。
原文表示返信0
TokenVelocityvip
· 16時間前
rlはチートしています
原文表示返信0
WhaleWatchervip
· 16時間前
モデルの自己修正は、おそらく人間よりも信頼できる。
原文表示返信0
SelfCustodyIssuesvip
· 16時間前
rtは本当に表裏の両面を分析していて、理解できる人には理解できる。
原文表示返信0
IfIWereOnChainvip
· 16時間前
また安全性を犠牲にする決定
原文表示返信0
DataPickledFishvip
· 16時間前
書くことができないコードのトレーニングだけを行います
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)