アンドロイドは推理小説を書くか?

treemacsを使う

これまでneotreeを使っていたが、treemacsに変えてみたのでメモ https://github.com/Alexander-Miller/treemacs https://github.com/rainstormstudio/treemacs-nerd-icons …

Emacs

2026-07-07

emacsのソースビルドメモ

emacs30の使うためのbuildメモ linuxのGUI利用で、tree-sitter, xwidget, native compile, svg描画あたりを動作させたい想定準備公式のサイトからzip or tarをダウンロー …

Emacs

2026-06-26

nano-emacsを使ってみる

emacsのシンプルなテーマ。極限まで無駄を削ぎ落としたミニマルで洗練された外観が特徴。editorとしてnanoがあるがそれとは別。 nano-emacs https://github.com/rougier/nano-emacs 白をベースとしたシンプルなテーマ。 reditとかで結構使ってる人 …

Emacs

2026-06-26

ef-themeでemacsにgithub light風のthemeを設定する

githubでコードを読むことも多いので、emacsのthemeもgithub風に寄せようと思う。 github風のthemeはいくつか配布されていが、最近のgithub themeっぽくなかったので、ef-themesをベースに設定していく。 …

Emacs

2026-06-24

emacsにおしゃれなHUDを表示する

Emacsのフレーム右上に状態管理HUDがreditで紹介されていた https://github.com/nohzafk/emacs-workspace-hud …

Emacs

2026-06-20

EVALUATING THE DIVERSITY AND QUALITY OF LLM GENERATED CONTENT

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2504.12522 AIが作る文章やプログラムの「質」と「種類の豊富さ（多様性）」をどう評価するかの研究です。この論文では、ただ多様なだけでなく「使える（質の高い）」アウトプット …

Nlp Deeplearning Paper_summary データセット指標

2025-05-21

Texygen: A Benchmarking Platform for Text Generation Models

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/1802.01886 サマリー本論文では、オープンドメインテキスト生成モデルの研究を支援するためのベンチマークプラットフォームである Texygen を紹介す …

Nlp Deeplearning Paper_summary データセット指標

2025-05-21

データセット評価指標

以下では LLM 学習用データセットの多様性（あるいは「同質性」を避けられているか）を測る代表的な指標を、定義 → 計算方法 → 読み取り方 → 長所/限界の順で簡潔に整理します。 distinct-N paper code 定義生成コーパス（または学習データ）の中で重複を除いた n-gram …

Nlp Deeplearning Chat データセット指標

2025-05-20

Measuring Diversity in Synthetic Datasets

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2502.08512 https://github.com/bluewhalelab/dcscore この論文は、AI（特に大規模言語モデル）が作る学習用データセットの「中身のバラ …

Nlp Deeplearning Paper_summary データセット指標

2025-05-20

Hugoでkatexを使った数式が表示されなくて困った

Hugoで数式を表示するためにkatex@0.16.22を利用している。 https://katex.org/docs/browser 基本的に表示されるが表示されないこともあり困っていた。結論 shortcodeを作る以下のようなpassthroughするだけのショートコー …

Hugo

2025-05-20

Beyond Scale: The Diversity Coefficient as a Data Quality Metric for Variability in Natural Language Data

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2306.13840 https://github.com/brando90/beyond-scale-language-data-diversity サマリー本論文は、LLMの …

Nlp Deeplearning Paper_summary データセット指標

2025-05-19

On the Diversity of Synthetic Data and its Impact on Training Large Language Models

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/html/2410.15226v2 エグゼクティブサマリー本論文は synthetic data の多様性が Large Language Models (LLMs) の性能に与える影 …

Nlp Deeplearning Paper_summary データセット指標

2025-05-19

Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://ceur-ws.org/Vol-3290/short_paper2780.pdf 背景と目的既存の語彙多様度指標（TTR、Shannon entropy 等）は表層文字列のユニークさに依存するため，OCR …

Nlp Deeplearning Paper_summary

2025-05-18

Between Circuits and Chomsky: Pre-pretraining on Formal Languages Imparts Linguistic Biases (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2502.19249 どんなものこの研究は、形式言語での事前事前学習が自然言語学習に役立つことを示し、どのような形式言語が有効な帰納バイアス（inductive bias）を与え …

Nlp Deeplearning Paper_summary

2025-05-17

TinyHelen’s First Curriculum: Training and Evaluating Tiny Language Models in a Simpler Language Environment (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.00522 どんなものこの研究は、大規模言語モデル（LLM）の訓練に必要なリソースを削減するために、「簡素な言語環境」を構築し、その中で小型の言語モデル（Tiny …

Nlp Deeplearning Paper_summary

2025-05-17

Towards Data-Efficient Language Models: A Child-Inspired Approach to Language Learning (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2503.04611 どんなもの本論文は、従来の大規模言語モデル（LLM）と比べて大幅に少ないデータで言語モデル（LM）を訓練する手法を提案しています。その手法は、人間の子供が言 …

Nlp Deeplearning Paper_summary

2025-05-17

Language Model Can Listen While Speaking (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2408.02622 どんなもの本論文は、リアルタイムの双方向音声対話を実現する、Listening-while-Speaking Language Model (LSLM) を …

Nlp Deeplearning Paper_summary

2025-01-18

MiniMax-01: Scaling Foundation Models with Lightning Attention (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.08313 どんなもの MiniMax-01シリーズ（MiniMax-Text-01とMiniMax-VL-01を含む）は、最先端モデルと同等の性能を持ちながら、より長い …

Nlp Deeplearning Paper_summary

2025-01-18

SentenceVAE: Enable Next-sentence Prediction for Large Language Models with Faster Speed, Higher Accuracy and Longer Context (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2408.00655 どんなもの Large Language Models (LLMs) の推論効率を向上させるための新しい推論方法である next-sentence …

Nlp Deeplearning Paper_summary

2025-01-18

Small Language Models (SLMs) Can Still Pack a Punch: A survey (AI論文要約)

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.05465 どんなもの本論文 “Small Language Models (SLMs) Can Still Pack a Punch: A …

Nlp Deeplearning Paper_summary

2025-01-18