2026
2 posts
01-19
多様体制約付きハイパーコネクション (mHC) の数理的構造と大規模言語モデルにおける安定化:残差結合の拡張と制御
#Deep Learning #Transformer #Optimization #Differential Geometry #LLM #System Architecture
01-11
TransformerアーキテクチャにおけるSelf-Attention機構の数理的定式化と系列変換タスクへの適用
#Machine Learning #Natural Language Processing #Transformer #Neural Networks #Attention Mechanism #arXiv