程序语言是表述文档中搜寻商业模式的特定数组。 re.findall (是用作抽取数组表达式结尾的Python最基本上的程序语言表达式众所周知。 采用此表达式能沙莱县YouTube音频副标题和播映单次间的关系。
下两个!
具体来说获得python程序语言组件“re”:
引入re
假定有下列数组:
test _ string 1= python is amazing!
假如将表达式R \ w 与数组一同传达给 re.findall ,则回到输出数组的第二个字符串。
regex_1=re.findall(r\w ,test _ string 1;列印) regex_1) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。) )
在表达式r \ w 中,字符串 {w 相关联于数组的结尾,\ w 相匹配数组中的拉丁字母位数字符串。
乘以“”获得:
regex_1=re.findall(r\w ,test _ string 1;列印) regex_1) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。) )
已经开始抽取另两个数组实例:
Test_string2=Java is Amazing!
相片:无炸裂
那时,应用领域“re.findall”查找数组中的第二个单词。
regex_2=re.findall(r\w ,测试数组2;列印) regex_2) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。) )
其次,考虑更现实的方案。 假定有YouTube电影的副标题列表及其相关联的YouTube观看单次。 我们可能有兴趣分析音频副标题的第二个单词和相关联音频的观看单次间的亲密关系。 请考虑下列副标题/观看单次元组列表。
YouTube _ titles=[ howtotellifwe rebeatingcovid-19 ,220000,extreme closed clean out ,各副标题的第二个单词:通过下列方法找到
fortitleinyoutube _ titles 3360列印(r .查找所有(r \w ,副标题[0] ]0) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。) )
能将这些值添加到列表中。first _ words=[ ]
也能按如下方式添加显示单次。
first _ words=[ ] views=[ ]福特Itleinyoutube _ titles 3360第一_ words.append (
然后,能创建音频前缀值和音频观看单次的数据库。
importpandasaspddf=PD .数据帧“第一_世界”:第一_世界,“视图”3360视图prr
然后,能对每个副标题前缀进行分组,并计算每个副标题的平均显示单次。
Df=df。 组方(第二个) )视图)。 mean ()列印(df ) )。
要按降序对这些值进行排序,请执行下列操作:
Df=df。 组方(第二个) )视图)。 mean ()。 sort _ values (增量=假;列印) df ) )。
假定这些结果来自数千个副标题和足够的数据集(如观看单次),则这种类型的分析将有助于选择最佳的YouTube音频副标题。
相片:无炸裂本文档介绍如何在python程序语言组件中采用re.findall ()表达式。 为了抽取每个数组的第二个单词,作者把这个表达式应用领域到了两个简单的字符串串上。 接下来,考虑实际的采用案例,采用该表达式抽取YouTube音频副标题中的第二个单词,计算与第二个单词相相关联的平均收看单次。
YouTube订阅 ,买粉丝,刷专业赞,追随者,加关注,刷评论,买点赞,刷观看量。请加微信ins1520