🍉

NLP News #6

  • ※ 試験的に、前回までの形式から少し変更しています。ご意見等ありましたら今回のNLP Hacksのアンケートなどで教えていただけますと幸いです 🙇
    • 前回まで: 1情報に5〜10分程度かけて深ぼる形
    • 今回: 1情報にかける時間を短くして、多めに情報掲載

Parti

  • 自己回帰ベースのtext-to-imageモデル
  • PartiPrompts (P2)
    • 1,600件超えの、多様なカテゴリ・難易度のpromptを含むベンチマーク
  • モデルサイズが大きくなるほど高品質な画像が生成可能
  • image

  • 拡散モデルとの比較
  • image

YaLM 100B

  • 100Bパラメータの言語モデル (英語対象)
  • もともとYandexは、Aliceというボイスアシスタントやら検索サービスやらで大規模言語モデルを使っていたとのこと
  • 大規模言語モデル学習にあたってのもろもろの知見も上記ブログで紹介されている
    • PyTorchのprofilerで性能改善しよう
    • image
    • 型を適切に選ぼう
    • image
    • etc…

NLLB-200

系譜
image
  • 100言語を扱えるモデルに比べても高い性能
image

BLOOM

DALL·E 2 Prompt Book

image
image

日本語映画推薦対話データセット (JMRD)

image

そのほかの主なニュース