BERT模型源码解析( 五 ) _生活百科

Args:   输入参数：激活函数名
activation_string: String name of the activation function.
返回值：相应的激活函数。
如果输入的字符串为None、 empty或者"linear"，就会返回None 。
如果输入参数不是字符串类型，就会返回 `activation_string`
Returns:
A Python function corresponding to the activation function. If
`activation_string` is None, empty, or "linear", this will return None.
If `activation_string` is not a string, it will return `activation_string`.
Raises: 异常：如果字符串无法匹配任何一个激活函数
ValueError: The `activation_string` does not correspond to a known
activation.
"""
如果入参不是字符串，就直接返回去
# We assume that anything that"s not a string is already an activation
# function, so we just return it.
if not isinstance(activation_string, six.string_types):
return activation_string
if not activation_string: 如果字符串为None或者empty，则返回None
return None
将入参字符串转换为小写
act = activation_string.lower()
if act == "linear":
return None
elif act == "relu":   热卤激活函数
return tf.nn.relu
elif act == "gelu":   格鲁激活函数
return gelu
elif act == "tanh":   反正切激活函数
return tf.tanh
else:             触发异常
raise ValueError("Unsupported activation: %s" % act)
读取
检查点
■从检查点获取任务映射
def get_assignment_map_from_checkpoint(tvars, init_checkpoint):
"""Compute the union of the current variables and checkpoint variables."""
获取当前变量和检查点变量
assignment_map = {}
initialized_variable_names = {}
OrderedDict的 Key 会按照插入的顺序排列，不是Key本身排序
name_to_variable = collections.OrderedDict()
for var in tvars:
name = var.name
m = re.match("^(.*):\\d+$", name)
if m is not None:
name = m.group(1)
name_to_variable[name] = var
init_vars = tf.train.list_variables(init_checkpoint)
assignment_map = collections.OrderedDict()
for x in init_vars:
(name, var) = (x[0], x[1])
if name not in name_to_variable:
continue
assignment_map[name] = name
initialized_variable_names[name] = 1
initialized_variable_names[name + ":0"] = 1
return (assignment_map, initialized_variable_names)
丢弃
标准化
初始化
■丢弃函数
def dropout(input_tensor, dropout_prob):
"""Perform dropout. 进行丢弃
Args:  参数
input_tensor: float Tensor. 输入的张量
dropout_prob: Python float. The probability of dropping out a value (NOT of
*keeping* a dimension as in `tf.nn.dropout`).  丢弃某个值的概率
Returns: 返回值：丢弃部分数据后的张量
A version of `input_tensor` with dropout applied.
"""  如果丢弃概率为None或者为0，则原封不动的返回
if dropout_prob is None or dropout_prob == 0.0:
return input_tensor
  1、tf.nn.dropout 中参数 keep_prob :每一个元素被保存下的概率。
2、tf.layer.dropout 中参数 rate :每一个元素丢弃的概率。keep_prob = 1 - rate
def dropout(x, keep_prob, noise_shape=None, seed=None, name=None)
要么保留，要么丢弃，所以keep_prob+dropout_prob=1
output = tf.nn.dropout(input_tensor, 1.0 - dropout_prob)
return output
■数据标准化
def layer_norm(input_tensor, name=None):
"""Run layer normalization on the last dimension of the tensor."""
return tf.contrib.layers.layer_norm(
inputs=input_tensor, begin_norm_axis=-1, begin_params_axis=-1, scope=name)

BERT模型源码解析( 五 )

经验总结扩展阅读

怎么把握电烤箱的时间和火候?

银耳汤能过夜吗

热水器的水能喝吗,热水器里的水能喝吗

翡翠手镯用手泡后结晶是什么

1.感情是一件很自然的事情一段爱意的消失，从来不是一个人的责任，而是两个人缘分的散尽

汴梁都市网卫健资讯|开封市人民医院迎接河南省健康促进医院创建工作评审组检查验收

手机Oppo R9s plus的优缺点的浅谈 oppo r9s plus参数配置

人老了人老了不必为了那些”见不得你好“的人浪费自己的时光，活好自己

结婚婚姻大事，最好不要太随便，不要太着急了

婚姻咨询师范俊娟|从小恨极了我妈的强势，却没在意丈夫说过：你和你妈真是一模一样

2019带子字的男孩名字好名字一定不能错过

有时候在爱情里，你若做到这一点，就可能会收获更多的幸福

有机和无机有什么区别?

硫磺皂可以洗脸吗用硫磺皂洗脸的利与弊

玉集|哪些爽肤水补水效果好？这些爽肤水，美白补水细滑肌肤，紧致肌肤

自动离合版是什么意思

心脏抬头纹增多未必就是老了，也许是身体在发出“警告”

一旦爱上这五大星座就放不下了

浅析松鼠桂鱼是什么菜系？

黄瓜跟什么一起吃会腹泻详解八种常见食物