CRF

CRFtag: #NLP #Basis条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。先来张《自然语言处理入门》的图。可以浅显地认为,机器学习就是给你随机变量 $x$,求(预测)出另一些随机变量 $y$。如果 $y$ 是连续型随机变量(如明天的股价),那就是回归问题;如果是离散

- 阅读全文 -

【NLP】RoBERTa: A Robustly Optimized BERT Pretraining Approach

RoBERTa: A Robustly Optimized BERT Pretraining Approachtag: #ReadPaper #NLPQ1 论文试图解决什么问题?如何使用更好的超参数与数据集对 BERT 进行充分的训练。Q2 这是否是一个新的问题?学疏才浅,不清楚,但应该是的。不谈 novelty, 自从 BERT 提出后,在其框架上做出一些改动获得一些效果,这种想法应该是显而易见

- 阅读全文 -

【NLP】Named Entity Recognition 未完待续

NERWikipediaNamed-entity recognition (NER) (also known as (named) entity identification, entity chunking, and entity extraction) is a subtask of information extraction that seeks to locate and classif

- 阅读全文 -

【NLP】粗读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

粗读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding[TOC]BERT 可以在一个比较大的数据集上,训练好比较深的神经网络(预训练模型),使其应用在很多 NLP 的任务上面,简化了训练,并提升了性能。标题解释一下 Pre-training,如果在一个大的数据集上训练好一个模型,但该模型

- 阅读全文 -

【NLP】初探

【NLP】初探整理自网络,感谢 OpenBMB,PaperWeekly, MLT Artificial Intelligence。有监督学习文本数据搜集和预处理将文本进行编码和表征从 one-hot 表示一个词到用 bag-of-words 来表示一段文本,从 k-shingles 把一段文本切分成一些文字片段,到汉语中用各种序列标注方法将文本按语义进行分割,从 tf-idf 中用频率的手段来表

- 阅读全文 -

离散数学学习指北

离散数学学习指北[TOC]应老师之约,特写此文,顺便纪念下三个学期的离散数学满绩。没有笔记,只是经验。水平有限,仅供参考。什么是离散数学抄一段维基百科:smile:离散数学(英语:discrete mathematics)是数学的几个分支的总称,研究基于离散空间而不是连续的数学结构。与连续变化的实数不同,离散数学的研究对象——例如整数、图和数学逻辑中的命题——不是连续变化的,而是拥有不等、分立的值

- 阅读全文 -

【搞机】安卓搞机备忘录(施工中)

【搞机】安卓搞机备忘录[TOC]工具adbfastboot解 BL 锁如果无法安装驱动的,可以去设备管理器里手动更新,驱动位置在 miflash_unlock。刷 RECTWRP橙狐()刷 Magisk(获取 Root 权限)MagiskSU: Provide root access for applicationsMagisk Modules: Modify read-only partitio

- 阅读全文 -

【数学】专项训练(施工中)

math[TOC]1 复数,位运算,快速幂,欧几里得算法之所以在第一次训练时大量选用了洛谷的题,主要是因为它有自动推荐的功能它是中文题面,还集成了题解,适合测试板子。十分友好,适合新手入门。由于我们的 VJ 暂不支持洛谷,所以请自己注册洛谷账号并,到时会手动记录做题情况。除此之外,大量的题目都非常友好,主要是锻炼英文读题能力同学们的手速,加强对数学的兴趣,培养出选数学专题的信心。如果思考了一小时还

- 阅读全文 -

最新文章

最近回复

  • Shining: 阿巴阿巴
  • 阿柒r7: 感谢,解决了问题
  • kif: 能有幸出现在孙巨的博客友链里吗?回寝室就加上孙巨的链接!Blog...
  • : 孙巨巨太强了
  • ASC_8384: 太难,不会,没钱买

分类

标签

归档

其它