AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2504.12522 AIが作る文章やプログラムの「質」と「種類の豊富さ(多様性)」をどう評価するかの研究です。この論文では、ただ多様なだけでなく「使える(質の高い)」アウトプット …
Texygen: A Benchmarking Platform for Text Generation Models
データセット評価指標
Measuring Diversity in Synthetic Datasets
Hugoでkatexを使った数式が表示されなくて困った
Hugoで数式を表示するためにkatex@0.16.22を利用している。 https://katex.org/docs/browser 基本的に表示されるが表示されないこともあり困っていた。 結論 shortcodeを作る 以下のようなpassthroughするだけのショートコードを作る …
Beyond Scale: The Diversity Coefficient as a Data Quality Metric for Variability in Natural Language Data
On the Diversity of Synthetic Data and its Impact on Training Large Language Models
Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases (AI論文要約)
Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2502.19249 どんなもの この研究は、形式言語での事前事前学習が自然言語学習に役立つことを示し、どのような形式言語が有効な帰納バイアス(inductive bias)を与え …
TinyHelen’s First Curriculum: Training and Evaluating Tiny Language Models in a Simpler Language Environment (AI論文要約)
Towards Data-Efficient Language Models: A Child-Inspired Approach to Language Learning (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2503.04611 どんなもの 本論文は、従来の大規模言語モデル(LLM)と比べて大幅に少ないデータで言語モデル(LM)を訓練する手法を提案しています。その手法は、人間の子供が言 …
Language Model Can Listen While Speaking (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2408.02622 どんなもの 本論文は、リアルタイムの双方向音声対話を実現する、Listening-while-Speaking Language Model (LSLM) を …
MiniMax-01: Scaling Foundation Models with Lightning Attention (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.08313 どんなもの MiniMax-01シリーズ(MiniMax-Text-01とMiniMax-VL-01を含む)は、最先端モデルと同等の性能を持ちながら、より長い …
SentenceVAE: Enable Next-sentence Prediction for Large Language Models with Faster Speed, Higher Accuracy and Longer Context (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2408.00655 どんなもの Large Language Models (LLMs) の推論効率を向上させるための新しい推論方法である next-sentence …
Small Language Models (SLMs) Can Still Pack a Punch: A survey (AI論文要約)
Tensor Product Attention Is All You Need (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.06425 どんなもの Tensor Product Attention (TPA) は、クエリ(Q)、キー(K)、バリュー(V)をコンパクトに表現するためにテンソル分解 …
Titans: Learning to Memorize at Test Time (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.00663 どんなもの Titansは、テスト時に情報を記憶することを学習する新しいニューラル長期記憶モジュールを備えた、深層学習アーキテクチャのファミリーです。 このモ …
Transformer2 : Self-adaptive LLMs (AI論文要約)
Phi-4 Technical Report (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2412.08905 どんなもの 140億パラメータの言語モデルphi-4。データの質に重点を置いたトレーニングレシピで開発された。ウェブコンテンツやコードなどのオーガニックデータ …
Can LLMs Design Good Questions Based on Context? (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.03491 どんなもの 本論文は、Large Language Models (LLMs)を用いたコンテキストベースの質問生成 (Question Generation: …