向 Transformer 中引入先验知识 [LLM]
Transformer 作为深度学习模型,并未显式利用语言学结构或相关先验假设,但我们仍有必要将先验知识融入这类模型。究其原因,NLP 领域的研究者一直认为,想要构建理想的自然语言处理系统,需要对数据进行更高层级的抽象表示,目前也已有大量模型引入了结构先验。本节主要讨论如何将语言学结构融入 Transformer 模型,对 encoder 进行改进。
Cover Image of the Post
PyTorch 中的 Transformer 源码 [LLM]
上节我们自己实现了一个 Transformer,这节我们通过源码来看一下 PyTorch 官方是如何实现 Transformer 的。内容按以下顺序进行:从最简单的注意力组件开始向上直到顶层的 Transformer 类。
Cover Image of the Post
Stern's Introductory Plant Biology Ch.4
chapter 4
Cover Image of the Post
芥川龍之介: 黄梁夢
黄粱梦
Cover Image of the Post
芥川龍之介: 女体
女体
Cover Image of the Post
Transformer 的代码实现 [LLM]
Cover Image of the Post
芥川龍之介: 虱
虱子
Cover Image of the Post
Transformer 的数学原理 [LLM]
Transformer 和一般 seq2sqe 模型的区别:
Cover Image of the Post
LaTeX 入门 [LaTeX]
Overleaf 中的 LaTeX 入门文档
Cover Image of the Post
😐 LeetCode 2. 两数相加 [链表]
给你两个非空的链表,表示两个非负的整数。它们每位数字都是按照逆序的方式存储的,并且每个节点只能存储一位数字。
Cover Image of the Post
Profile Image of the Author
永雏多氢菲
∴さて····どこへ行こうか?
公告
随缘分享喵
Music
Cover

Music

No playing

0:00 0:00
No lyrics available
Categories
Tags
Site Statistics
Posts
144
Categories
6
Tags
9
Total Words
2,255,454
Running Days
0 days
Last Activity
0 days ago

Table of Contents