为什么这种情况下熊猫数据帧分配引发TypeError

环境:

Python 3.6.4
pandas 0.23.4

我的代码如下.

from math import sqrt
import pandas as pd
df = pd.DataFrame({'x':[1,2,3],'y':[4,5,6]})

df = df.assign(d = lambda z: sqrt(z.x**2 + z.y**2))

最下面的一行引发TypeError,如下所示.

...
TypeError: cannot convert the series to <class 'float'>

没有sqrt,它可以工作.

df = df.assign(d2 = lambda z: z.x**2 + z.y**2)
df
Out[6]:
   x  y  d2
0  1  4  17
1  2  5  29
2  3  6  45

并申请也有效.

df['d3'] = df.apply(lambda z: sqrt(z.x**2 + z.y**2),axis=1)
df
Out[8]:
   x  y  d2        d3
0  1  4  17  4.123106
1  2  5  29  5.385165
2  3  6  45  6.708204

第一个怎么了?

最佳答案
使用numpy.sqrt-它也适用于一维数组,而来自数学的sqrt仅适用于标量:

df = df.assign(d = lambda z: np.sqrt(z.x**2 + z.y**2))

另一个解决方案是使用**(1/2):

df = df.assign(d = lambda z: (z.x**2 + z.y**2)**(1/2))
print (df)
   x  y         d
0  1  4  4.123106
1  2  5  5.385165
2  3  6  6.708204

您的解决方案可以正常工作,因为轴= 1在应用中按标量进行工作,但是像提到的@jpp一样,应用不应被首选,因为它涉及Python级的逐行循环.

df.apply(lambda z: print(z.x),axis=1)
1
2
3

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...