当前位置: 首页 > news >正文

建大仁科公司网站网络营销的一般流程

建大仁科公司网站,网络营销的一般流程,找个人合伙做网站,网站开发公司管理模式文章目录 1、自注意力机制2、多头注意力机制 transformer的整体结构: 1、自注意力机制 自注意力机制如下: 计算过程: 代码如下: class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_…

文章目录

  • 1、自注意力机制
  • 2、多头注意力机制

  • transformer的整体结构:
    在这里插入图片描述

1、自注意力机制

  • 自注意力机制如下:
    在这里插入图片描述
  • 计算过程:
    在这里插入图片描述
  • 代码如下:
class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_size):super().__init__()self.W_q = nn.Linear(embed_dim, key_size, bias=False)self.W_k = nn.Linear(embed_dim, key_size, bias=False)self.W_v = nn.Linear(embed_dim, value_size, bias=False)def forward(self, x, attn_mask=None):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量attn_mask: (N, L, L),用于对注意力矩阵(L, L)进行mask输出:shape:(N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)scores = torch.matmul(query, key.transpose(1, 2)) / math.sqrt(query.size(2))if attn_mask is not None:scores = scores.masked_fill(attn_mask, 0)attn_weights = F.softmax(scores, dim=-1)	# dim为-1表示,对每个嵌入向量与其他所有向量的注意力权重,进行softmax,以使每一行的和为1return torch.matmul(attn_weights, value)

2、多头注意力机制

  • 结构如下:
    在这里插入图片描述
  • 计算过程如下:
class MultiHeadSelfAttention(nn.Module):def __init__(self, embed_dim, num_heads, key_size, value_size, bias=False):super().__init__()self.embed_dim = embed_dimself.num_heads = num_headsself.q_head_dim = key_size // num_headsself.k_head_dim = key_size // num_headsself.v_head_dim = value_size // num_headsself.W_q = nn.Linear(embed_dim, key_size, bias=bias)self.W_k = nn.Linear(embed_dim, key_size, bias=bias)self.W_v = nn.Linear(embed_dim, value_size, bias=bias)        self.q_proj = nn.Linear(key_size, key_size, bias=bias)self.k_proj = nn.Linear(key_size, key_size, bias=bias)self.v_proj = nn.Linear(value_size, value_size, bias=bias)self.out_proj = nn.Linear(value_size, embed_dim, bias=bias)def forward(self, x):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量Returns:output: (N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)q, k, v = self.q_proj(query), self.k_proj(key), self.v_proj(value)N, L, value_size = v.size()q = q.reshape(N, L, self.num_heads, self.q_head_dim).transpose(1, 2)k = k.reshape(N, L, self.num_heads, self.k_head_dim).transpose(1, 2)v = v.reshape(N, L, self.num_heads, self.v_head_dim).transpose(1, 2)att = torch.matmul(q, k.transpose(-1, -2)) / math.sqrt(k.size(-1))att = F.softmax(att, dim=-1)output = torch.matmul(att, v)output = output.transpose(1, 2).reshape(N, L, value_size)output = self.out_proj(output)return output
http://www.ahscrl.com/news/11841.html

相关文章:

  • 网站建设合作合同范文鹤壁网络推广哪家好
  • 厦门广告公司网站建设软文撰写
  • 做网站干嘛今天最新新闻10条
  • 欧美独立站建站网站建设企业
  • 做网站fjfzwl制作网站推广
  • 万网可以花钱做网站百度统计app下载
  • 做食物的网站友情链接检测工具
  • wordpress 获取当前用户信息某网站seo诊断分析和优化方案
  • 企业网站设计开发天津搜索引擎优化
  • 电影网站怎么做关键词怎样建网站
  • 做电池网站的引导页东莞网站营销推广
  • wordpress 置顶字段悟空建站seo服务
  • 花都微网站建设凤凰网台湾资讯
  • 网站内容管理系统 下载百度爱采购怎么优化排名
  • 落地页网站网站设计公司模板
  • 建设小说网站用什么软件下载网络营销策划的概念
  • 怎么创网站数据库营销
  • 在线培训app免费外链网站seo发布
  • 国内外网站开发情况对比企业seo培训
  • 互诺 外贸网站建设广州网站快速排名
  • 为什么不能安装wordpressseo专员是干什么的
  • 数据库支持的网站怎么做百度在线识图查图片
  • 为什么很多网站在维护百度官方首页
  • windows2008 iis 网站百度手机助手下载2022官方正版
  • 泉州网站建设公司郴州网站seo
  • 网站建设 方案快优吧seo优化
  • b2b平台网站源码搜索关键词查询
  • 网站服务类型有哪些网络项目推广平台
  • js与asp.net做的网站宁波免费seo在线优化
  • 什么网站可以做私房菜外卖惠州搜索引擎优化