Vilhelm Toivonen

Vilhelm Toivonen — Writing https://vtoivonen.com/blog Doctoral Researcher at University of Helsinki. Distributed AI, edge deployment, knowledge transfer, and AI safety. en-us noreply@vtoivonen.com (Vilhelm Toivonen) Mon, 04 May 2026 18:57:45 GMT https://vtoivonen.com/og/default.png Vilhelm Toivonen — Writing https://vtoivonen.com/blog Per-user memory in language models: what we tried https://vtoivonen.com/blog/per-user-memory-composition https://vtoivonen.com/blog/per-user-memory-composition Fri, 01 May 2026 00:00:00 GMT Vilhelm Toivonen language-models/interpretability language-models/inference/kv-cache optimization/low-rank Sparse embeddings: a six-week negative result https://vtoivonen.com/blog/sparse-embeddings-parameter-golf https://vtoivonen.com/blog/sparse-embeddings-parameter-golf Fri, 24 Apr 2026 00:00:00 GMT Vilhelm Toivonen language-models/inference/quantization language-models/training/pretraining ml-systems/storage Quantization is a hardware story (and an entropy puzzle) https://vtoivonen.com/blog/quantization-hardware-pareto-entropy https://vtoivonen.com/blog/quantization-hardware-pareto-entropy Fri, 17 Apr 2026 00:00:00 GMT Vilhelm Toivonen language-models/inference/quantization ml-systems/hardware math/information-theory State-space models, the edge, and the quiet convergence https://vtoivonen.com/blog/state-space-models-edge-and-convergence https://vtoivonen.com/blog/state-space-models-edge-and-convergence Fri, 10 Apr 2026 00:00:00 GMT Vilhelm Toivonen language-models/architecture/sequence-modeling language-models/architecture/attention language-models/inference/kv-cache ml-systems/hardware Attention variants beyond softmax: a 2026 map https://vtoivonen.com/blog/attention-variants-beyond-softmax https://vtoivonen.com/blog/attention-variants-beyond-softmax Fri, 03 Apr 2026 00:00:00 GMT Vilhelm Toivonen language-models/architecture/attention language-models/inference/kv-cache language-models/architecture/sequence-modeling ml-systems/hardware The modern transformer block (everything except attention) https://vtoivonen.com/blog/modern-transformer-block-without-attention https://vtoivonen.com/blog/modern-transformer-block-without-attention Fri, 27 Mar 2026 00:00:00 GMT Vilhelm Toivonen language-models/architecture/normalization language-models/architecture/feed-forward language-models/architecture/sequence-modeling language-models/architecture/positional Hi! https://vtoivonen.com/blog/hello-world https://vtoivonen.com/blog/hello-world Fri, 20 Mar 2026 00:00:00 GMT Vilhelm Toivonen lab-notes