Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

2022-09-08

Abstract

无监督学习典范 GPT可以通过zero/few-shot learning解决大部分问题，因为预训练GPT的时候已经在大量的无标签数据（45TB的数据岂是我等鼠人能够想象的？？😂）中学习到了语言的特点。
有监督学习也就是我们常见的fine-tuning学习，可以通过大量有标签的数据中学习，并解决大部分问题且比GPT表现的好。常见的就是微调各种BERT啦，比如我们提出的的SICKNet就是用有监督学习🤞。
作者提出一种半监督学习，叫做pattern-exploiting training (PET)🤔
- 目的是将手中少量 [有标签的输入样本] 转换为一种完形填空（cloze-style）的类型文本帮助语言模型理解任务
- 然后让PVP模型（后面会介绍这个工具人）对大量 [无标签的输入样本] 进行标签预测，称为软标签
- 让分类模型（真正的天选模型）对带有 [软标签的输入样本] 进行有监督学习训练

展开全文 >>

Humor Detection， A Transformer Gets the Last Laugh

2022-09-07

Abstract

之前大部分工作都是对幽默的识别，即判断文本是否幽默。在该文中，作者做出了三点贡献：

作者提出了一个新的任务：判断一个笑话是否是幽默（强幽默和弱幽默）。
作者从Reddit收集了16000条幽默文本，并根据网页上的点赞数标注文本的幽默程度。
作者基于Transformer的结构，实现了对上述文本幽默等级的预测。

作者证实了模型的性能与人类基准是可比的。

作者还进一步验证了模型在原先的幽默识别任务上也带来了提升，他使用了已有的短幽默语料和双关语语料。

展开全文 >>

STaR Self-Taught Reasoner Bootstrapping Reasoning With Reasoning

2022-09-06

Abstract

思维链的方式确实可以提高解决推理类的问题的性能，但是让模型生成思维链的这个过程却不是那么容易的，难点如下：
- 思维链本质是基本原理的子集，构建基本原理集需要大量数据集
- 尽管可以让大规模预训练模型通过few-shot learning的方式来生成思维链，但这样的性能不够好并且要求模型足够大
作者的提出了一个“自学推理”的过程，也就是
- 输入问题给模型
- 模型输出推理和答案
- 如果答案是错误的，那么就给出正确答案的提示，让模型再次尝试生成。
- 直到生成的答案是正确的，则让模型对这个（问题，不带提示的答案）进行微调
与微调直接预测最终答案的模型相比，STaR的性能在多个数据集上有所提高

展开全文 >>

Chain of Thought Prompting Elicits Reasoning in Large Language Models

2022-09-06

Abstract

探索了如何生成一系列思维链——一系列中间推理步骤——显著提高大型语言模型执行复杂推理的能力。the simple method called chain of thought prompting,
在三个大型语言模型上的实验表明，思维链提示提高了一系列算术、常识和符号推理任务的性能
在数学单词问题的GSM8K基准测试达到SOTA，超过基于微调的GPT3
论文图显示了“思维链推理”的过程，我感觉其实就是采用记录中间变量的形式来完成推理

展开全文 >>

缺失模块。
1、请确保node版本大于6.2
2、在博客根目录（注意不是yilia根目录）执行以下命令：
npm i hexo-generator-json-content --save

3、在根目录_config.yml里添加配置：

  jsonContent:
    meta: false
    pages: false
    posts:
      title: true
      date: true
      path: true
      text: false
      raw: false
      content: false
      slug: false
      updated: false
      comments: false
      link: false
      permalink: false
      excerpt: false
      categories: false
      tags: true

广州大学-研二-黄鹏龙研究方向：[情感分析] [幽默计算]