永雏多氢菲の書库

Literature 105 CS 19 Science 13 Paper 3 Uncategorized 3 Philosophy 1

向 Transformer 中引入先验知识 [LLM]

2026-05-28

Transformer 作为深度学习模型，并未显式利用语言学结构或相关先验假设，但我们仍有必要将先验知识融入这类模型。究其原因，NLP 领域的研究者一直认为，想要构建理想的自然语言处理系统，需要对数据进行更高层级的抽象表示，目前也已有大量模型引入了结构先验。本节主要讨论如何将语言学结构融入 Transformer 模型，对 encoder 进行改进。

#No Tags

Cover Image of the Post

PyTorch 中的 Transformer 源码 [LLM]

2026-05-27

上节我们自己实现了一个 Transformer，这节我们通过源码来看一下 PyTorch 官方是如何实现 Transformer 的。内容按以下顺序进行：从最简单的注意力组件开始向上直到顶层的 Transformer 类。

#No Tags

Cover Image of the Post

Stern's Introductory Plant Biology Ch.4

2026-05-27

chapter 4

Cover Image of the Post

芥川龍之介: 黄梁夢

2026-05-26

黄粱梦

Cover Image of the Post

芥川龍之介: 女体

2026-05-26

女体

Cover Image of the Post

Transformer 的代码实现 [LLM]

2026-05-26

#No Tags

Cover Image of the Post

芥川龍之介: 虱

2026-05-26

虱子

Cover Image of the Post

Transformer 的数学原理 [LLM]

2026-05-25

Transformer 和一般 seq2sqe 模型的区别:

#No Tags

Cover Image of the Post

LaTeX 入门 [LaTeX]

2026-05-25

Overleaf 中的 LaTeX 入门文档

#No Tags

Cover Image of the Post

😐 LeetCode 2. 两数相加 [链表]

2026-05-24

给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。

#No Tags

Cover Image of the Post

永雏多氢菲

∴さて····どこへ行こうか？

随缘分享喵

あ行か行さ行た行な行ま行哲学生物学轻小说

Posts

144

Categories

6

Tags

9

Total Words

2,255,454

Running Days

0 days

Last Activity

0 days ago

Table of Contents