区块链技术博客
www.b2bchain.cn

计算匹配字符串的实例和累计总值 – python程序员分享

本文介绍了计算匹配字符串的实例和累计总值 – python程序员分享,有助于帮助完成毕业设计以及求职,是一篇很好的资料。

对技术面试,学习经验等有一些体会,在此分享。

很难在标题上对此进行描述,但是鉴于以下两个DataFrame:

import pandas as pd import numpy as np import re   df1 = pd.DataFrame({ 'url': [   'http://google.com/car',    'http://google.com/moto',    'http://google.com/moto-bike' ], 'value': [3, 4, 6]})  url                           value http://google.com/car         3 http://google.com/moto        4 http://google.com/moto-bike   6  df2 = pd.DataFrame({'name': ['car','moto','bus']})    name 0 car 1 moto 2 bus 

我想看看df2上的名称出现在url上的df1上了多少次,并且可以通过以下方式进行管理:

df2['instances'] = pd.Series([df1.url.str.contains(fr'D{w}D', regex=True)  .sum() for w in df2.name.tolist()]) 

由于某种原因,汽车有零个实例,因此只有一个。

   name  instances 0   car          0 1  moto          2 2   bus          0 

我想做的是拥有另一列,该列将value的所有匹配项的df1列求和,所以看起来像这样:

   name  instances  value_total 0   car          1           3 1  moto          2          10 2   bus          0           0 

在正确的方向上的任何帮助将不胜感激,谢谢!

参考方案

尝试使用str.extract,然后将groupby与named aggregation合并(熊猫0.25+中的新功能):

pat = '|'.join(df2['name']) #'car|moto|bus' m = df2.merge(df1.assign(name=df1['url']             .str.extract('('+ pat + ')', expand=False)),on='name',how='left') m = m.groupby('name',sort=False).agg(instances=('value','count')                  ,value_total=('value','sum')).reset_index() 
print(m)     name  instances  value_total 0   car          1          3.0 1  moto          2         10.0 2   bus          0          0.0 

我有以下代码:import pandas as pd import requests from bs4 import BeautifulSoup res = requests.get("https://www.bankier.pl/gielda/notowania/akcje") soup = BeautifulSoup(res.cont…

df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice','Jane', 'Alice','Bob', 'Alice'], 'income&#03…

我需要计算Lindeman-Merenda-Gold(LMG)分数,以进行回归分析。我发现R语言的relaimpo包下有该文件。不幸的是,我对R没有任何经验。我检查了互联网,但找不到。这个程序包有python端口吗?如果不存在,是否可以通过python使用该包? python参考方案 最近,我遇到了pingouin库。

我正在使用本地节点js脚本来处理字符串。我陷入了将’-‘字符串解析为本地节点js脚本的问题。render.js:#! /usr/bin/env -S node -r esm let argv = require('yargs') .usage('$0 [string]') .argv; console.log(argv…

我的Web服务器的API日志如下:started started succeeded failed 那是同时收到的两个请求。很难说哪一个成功或失败。为了彼此分离请求,我为每个请求创建了一个随机数,并将其用作记录器的名称logger = logging.getLogger(random_number) 日志变成[111] started [222] start…

赞(0) 打赏
部分文章转自网络,侵权联系删除b2bchain区块链学习技术社区 » 计算匹配字符串的实例和累计总值 – python程序员分享
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

b2b链

联系我们联系我们