電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程16.7之自然語(yǔ)言推理：微調(diào)BERT

PyTorch教程16.7之自然語(yǔ)言推理：微調(diào)BERT

2512875 2023-06-05 | pdf | 0.22 MB | 次下載 | 免費(fèi)

資料介紹

在本章前面的部分中，我們?yōu)?SNLI 數(shù)據(jù)集上的自然語(yǔ)言推理任務(wù)（如第 16.4 節(jié)所述）設(shè)計(jì)了一個(gè)基于注意力的架構(gòu)（第16.5節(jié)）。現(xiàn)在我們通過(guò)微調(diào) BERT 重新審視這個(gè)任務(wù)。正如16.6 節(jié)所討論的，自然語(yǔ)言推理是一個(gè)序列級(jí)文本對(duì)分類(lèi)問(wèn)題，微調(diào) BERT 只需要一個(gè)額外的基于 MLP 的架構(gòu)，如圖 16.7.1所示。

https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9POGANyPIAAKGzmOF458734.svg

圖 16.7.1本節(jié)將預(yù)訓(xùn)練的 BERT 提供給基于 MLP 的自然語(yǔ)言推理架構(gòu)。

在本節(jié)中，我們將下載預(yù)訓(xùn)練的小型 BERT 版本，然后對(duì)其進(jìn)行微調(diào)以在 SNLI 數(shù)據(jù)集上進(jìn)行自然語(yǔ)言推理。

						import json
import multiprocessing
import os
import torch
from torch import nn
from d2l import torch as d2l

						 

						import json
import multiprocessing
import os
from mxnet import gluon, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

						 

16.7.1。加載預(yù)訓(xùn)練的 BERT

我們已經(jīng)在第 15.9 節(jié)和第 15.10 節(jié)中解釋了如何在 WikiText-2 數(shù)據(jù)集上預(yù)訓(xùn)練 BERT （請(qǐng)注意，原始 BERT 模型是在更大的語(yǔ)料庫(kù)上預(yù)訓(xùn)練的）。如15.10 節(jié)所述，原始 BERT 模型有數(shù)億個(gè)參數(shù)。在下文中，我們提供了兩個(gè)版本的預(yù)訓(xùn)練 BERT：“bert.base”與需要大量計(jì)算資源進(jìn)行微調(diào)的原始 BERT 基礎(chǔ)模型差不多大，而“bert.small”是一個(gè)小版本方便演示。

							d2l.DATA_HUB['bert.base'] = (d2l.DATA_URL + 'bert.base.torch.zip',
               '225d66f04cae318b841a13d32af3acc165f253ac')
d2l.DATA_HUB['bert.small'] = (d2l.DATA_URL + 'bert.small.torch.zip',
               'c72329e68a732bef0452e4b96a1c341c8910f81f')

							 

							d2l.DATA_HUB['bert.base'] = (d2l.DATA_URL + 'bert.base.zip',
               '7b3820b35da691042e5d34c0971ac3edbd80d3f4')
d2l.DATA_HUB['bert.small'] = (d2l.DATA_URL + 'bert.small.zip',
               'a4e718a47137ccd1809c9107ab4f5edd317bae2c')

							 

預(yù)訓(xùn)練的 BERT 模型都包含一個(gè)定義詞匯集的“vocab.json”文件和一個(gè)預(yù)訓(xùn)練參數(shù)的“pretrained.params”文件。我們實(shí)現(xiàn)以下load_pretrained_model 函數(shù)來(lái)加載預(yù)訓(xùn)練的 BERT 參數(shù)。

							def load_pretrained_model(pretrained_model, num_hiddens, ffn_num_hiddens,
             num_heads, num_blks, dropout, max_len, devices):
  data_dir = d2l.download_extract(pretrained_model)
  # Define an empty vocabulary to load the predefined vocabulary
  vocab = d2l.Vocab()
  vocab.idx_to_token = json.load(open(os.path.join(data_dir, 'vocab.json')))
  vocab.token_to_idx = {token: idx for idx, token in enumerate(
    vocab.idx_to_token)}
  bert = d2l.BERTModel(
    len(vocab), num_hiddens, ffn_num_hiddens=ffn_num_hiddens, num_heads=4,
    num_blks=2, dropout=0.2, max_len=max_len)
  # Load pretrained BERT parameters
  bert.load_state_dict(torch.load(os.path.join(data_dir,
                         'pretrained.params')))
  return bert, vocab

							 

							def load_pretrained_model(pretrained_model, num_hiddens, ffn_num_hiddens,
             num_heads, num_blks, dropout, max_len, devices):
  data_dir = d2l.download_extract(pretrained_model)
  # Define an empty vocabulary to load the predefined vocabulary
  vocab = d2l.Vocab()
  vocab.idx_to_token = json.load(open(os.path.join(data_dir, 'vocab.json')))
  vocab.token_to_idx = {token: idx for idx, token in enumerate(
    vocab.idx_to_token)}
  bert = d2l.BERTModel(len(vocab), num_hiddens, ffn_num_hiddens, num_heads,
             num_blks, dropout, max_len)
  # Load pretrained BERT parameters
  bert.load_parameters(os.path.join(data_dir, 'pretrained.params'),
             ctx=devices)
  return bert, vocab

							 

為了便于在大多數(shù)機(jī)器上進(jìn)行演示，我們將在本節(jié)中加載和微調(diào)預(yù)訓(xùn)練 BERT 的小型版本（“bert.small”）。在練習(xí)中，我們將展示如何微調(diào)更大的“bert.base”以顯著提高測(cè)試準(zhǔn)確性。

							devices = d2l.try_all_gpus()
bert, vocab = load_pretrained_model(
  'bert.small', num_hiddens=256, ffn_num_hiddens=512, num_heads=4,
  num_blks=2, dropout=0.1, max_len=512, devices=devices)

							 

							Downloading ../data/bert.small.torch.zip from http://d2l-data.s3-accelerate.amazonaws.com/bert.small.torch.zip...

						

							devices = d2l.try_all_gpus()
bert, vocab = load_pretrained_model(
  'bert.small', num_hiddens=256, ffn_num_hiddens=512, num_heads=4,
  num_blks=2, dropout=0.1, max_len=512, devices=devices)

							 

							Downloading ../data/bert.small.zip from http://d2l-data.s3-accelerate.amazonaws.com/bert.small.zip...

						

16.7.2。微調(diào) BERT 的數(shù)據(jù)集

對(duì)于 SNLI 數(shù)據(jù)集上的下游任務(wù)自然語(yǔ)言推理，我們定義了一個(gè)自定義的數(shù)據(jù)集類(lèi)SNLIBERTDataset。在每個(gè)示例中，前提和假設(shè)形成一對(duì)文本序列，并被打包到一個(gè) BERT 輸入序列中，如圖 16.6.2所示。回想第 15.8.4 節(jié) ，段 ID 用于區(qū)分 BERT 輸入序列中的前提和假設(shè)。對(duì)于 BERT 輸入序列 ( max_len) 的預(yù)定義最大長(zhǎng)度，輸入文本對(duì)中較長(zhǎng)者的最后一個(gè)標(biāo)記會(huì)不斷被刪除，直到max_len滿(mǎn)足為止。為了加速生成用于微調(diào) BERT 的 SNLI 數(shù)據(jù)集，我們使用 4 個(gè)工作進(jìn)程并行生成訓(xùn)練或測(cè)試示例。

							class SNLIBERTDataset(torch.utils.data.Dataset):
  def __init__(self, dataset, max_len, vocab=None):
    all_premise_hypothesis_tokens = [[
      p_tokens, h_tokens] for p_tokens, h_tokens in zip(
      *[d2l.tokenize([s.lower() for s in sentences])
       for sentences in dataset[:2]])]

    self.labels = torch.tensor(dataset[2])
    self.vocab = vocab
    self.max_len = max_len
    (self.all_token_ids, self.all_segments,
     self.valid_lens) = self._preprocess(all_premise_hypothesis_tokens)
    print('read ' + str(len(self.all_token_ids)) + ' examples')

  def _preprocess(self, all_premise_hypothesis_tokens):
    pool = multiprocessing.Pool(4) # Use 4 worker processes
    out = pool.map(self._mp_worker, all_premise_hypothesis_tokens)
    all_token_ids = [
      token_ids for token_ids, segments, valid_len in out]
    all_segments = [segments for token_ids, segments, valid_len in out]
    valid_lens = [valid_len for token_ids, segments, valid_len in out]
    return (torch.tensor(all_token_ids, dtype=torch.long),
        torch.tensor(all_segments, dtype=torch.long),
        torch.tensor(valid_lens))

  def _mp_worker(self, premise_hypothesis_tokens):
    p_tokens, h_tokens = premise_hypothesis_tokens
    self._truncate_pair_of_tokens(p_tokens, h_tokens)
    tokens, segments = d2l.get_tokens_and_segments(p_tokens, h_tokens)
    token_ids = self.vocab[tokens] + [self.vocab['']] \
               * (self.max_len - len(tokens))
    segments = segments + [0] * (self.max_len - len(segments))
    valid_len = len(tokens)
    return token_ids, segments, valid_len

  def _truncate_pair_of_tokens(self, p_tokens, h_tokens):
    # Reserve slots for '', '', and '' tokens for the BERT
    # input
    while len(p_tokens) + len(h_tokens) > self.max_len - 3:
      if len(p_tokens) > len(h_tokens):
        p_tokens.pop()
      else:
        h_tokens.pop()

  def __getitem__(self, idx):
    return (self.all_token_ids[idx], self.all_segments[idx],
        self.valid_lens[idx]), self.labels[idx]

  def __len__(self):
    return len(self.all_token_ids)

							 

							class SNLIBERTDataset(gluon.data.Dataset):
  def __init__(self, dataset, max_len, vocab=None):
    all_premise_hypothesis_tokens = [[
      p_tokens, h_tokens
						

加入交流群

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載下載該資料的人還在閱讀

更多 >

用于自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)有哪些 3.2k次閱讀
什么是自然語(yǔ)言處理 (NLP) 3.7k次閱讀
自然語(yǔ)言處理技術(shù)的原理的應(yīng)用 1.7k次閱讀
使用PyTorch搭建Transformer模型 3.3k次閱讀
神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用 1.3k次閱讀
PyTorch教程-16.7。自然語(yǔ)言推理：微調(diào) BERT 1.8k次閱讀
如何開(kāi)始使用PyTorch進(jìn)行自然語(yǔ)言處理 3.1k次閱讀
自然語(yǔ)言處理是什么？有什么用？ 6.9k次閱讀
多個(gè)視角對(duì)自然語(yǔ)言處理領(lǐng)域進(jìn)行全面梳理 4.3k次閱讀
AAAI 2019 Gaussian Transformer 一種自然語(yǔ)言推理方法 3.6k次閱讀
自然語(yǔ)言處理的ELMO使用 3.9k次閱讀
自然語(yǔ)言處理研究的基本問(wèn)題及發(fā)展趨勢(shì) 9.3k次閱讀
自然語(yǔ)言推理數(shù)據(jù)集“人工痕跡”嚴(yán)重，模型性能被高估 5.1k次閱讀
自然語(yǔ)言處理的優(yōu)點(diǎn)有哪些_自然語(yǔ)言處理的5大優(yōu)勢(shì) 3.1w次閱讀
RNN在自然語(yǔ)言處理中的應(yīng)用 6.1k次閱讀

評(píng)論

資料 -- | 積分 --

查看他上傳的所有資料

+關(guān)注個(gè)人主頁(yè)

上傳資料賺積分

下載排行

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

PyTorch教程16.7之自然語(yǔ)言推理：微調(diào)BERT

資料介紹

16.7.1。加載預(yù)訓(xùn)練的 BERT

16.7.2。微調(diào) BERT 的數(shù)據(jù)集

評(píng)論

下載排行

本周

本月

總榜

日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

PyTorch教程16.7之自然語(yǔ)言推理：微調(diào)BERT

資料介紹

16.7.1。加載預(yù)訓(xùn)練的 BERT

16.7.2。微調(diào) BERT 的數(shù)據(jù)集

評(píng)論

下載排行

本周

本月

總榜

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

16.7.1。加載預(yù)訓(xùn)練的 BERT

16.7.2。微調(diào) BERT 的數(shù)據(jù)集