-
itemsize,是每个元素的bytes数
查看全部 -
numpy
查看全部 -
def main() lst=[[1,3,5],[2,4,6]] print(type(lst)) np_lst=np.arry(slt) print(type(np_lst)) #ndarry里只能有一种数据类型 np_lst=np.arry(lst,dtype=np.float) #转化为float #bool,int,unint,float,complex等类型均支持 print(np_lst.shape) #打印矩阵的形状 print(np_lst.ndim) #维度(行数) print(np_lst.dtype) #元素类型 print(np_lst.itemsize) #每个元素的大小,float为8 print(np_lst.size) #所有元素个数
查看全部 -
本节代码 df1=df.reindex(index=dates[:4],columns = list("ABCD")+["G"]) df1.loc[dates[0]:dates[1],"G"]=1 print (df1) #丢弃数据 print(df1.dropna()) #填充数据 print(df1.fillna(value=1))
查看全部 -
本节代码 #pandas表统计与整合 #均值 print(df.mean()) #方差 print(df.var()) s=pd.Series([1,2,4,np.nan,5,7,9,10],index=dates) print(s) print(s.shift(2)) print(s.diff()) print(s.value_counts()) #累加 print(df.apply(np.cumsum)) #极差 print(df.apply(lambda x:x.max()-x.min())) #表格拼接 pieces=[df[:3],df[-3:]] print (pieces) left=pd.DataFrame({"key":["x","y"],"value":[1,2]}) right=pd.DataFrame({"key":["x","z"],"value":[3,4]}) print("LEFT:",left) print("RIGHT:",right) print(pd.merge(left,right,on="key",how="outer")) df3=pd.DataFrame({"A":["a","b","c","d"],"B":list(range(4))}) print(df3.groupby("A").sum())
查看全部 -
#Basic print(df.head(3)) #head()打印出前几行 print(df.tail(3)) #tail()打印出后几行 print(df.index) #index()打印出索引 print(df.values) #values()打印出values print(df.T) #T 转置 print(df.sort(columns="C")) #第C列的values按从小到大的顺序排序 print(df.sort_index(axis=1,ascending=False)) #将index进行降序排序 print(df.describe()) #打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
查看全部 -
list = np.array([[[1, 2, 3, 4], [4, 5, 6, 7, ]], [[7, 8, 9, 10], [11, 12, 13, 14]], [[15, 16, 17, 18], [19, 20, 21, 22]] ]) axis取值跟维数有关,维数从 0 开始算起,axis值越大,深入的程度越深 print (list.sum(axis=0))# axis表示维度,sxis=0,表示最外层的元素相加 print (list.sum(axis=1))# 表示最外层减一层的元素相加 print (list.max(axis=0)) # 最外层元素中的最大元素值 print (list.min(axis=0)) # 最外层元素中的最小元素值 list1 = np.array([10, 20, 30, 40]) list2 = np.array(([4, 3, 2, 1])) print(list1 + list2) # 对两个list中的元素相加,ps:不是将一个数组中的元素放在另一个后面 print (list1-list2) # 对两个list中的元素相 print (list1**2) # 对两个list中的元素平方 print (list1/list2)# 对两个list中的元素相除 print (list1.reshape([2, 2])) print (list2.reshape([2, 2])) print (np.dot(list1.reshape([2, 2]), list2.reshape([2, 2]))) # 数组点乘 print(np.concatenate((list1,list2),axis = 0)) #将两个数组相连,即list2添加到list1中,传的是tup
查看全部 -
python 中的 list 可以放多种类型,numpy 底层是 C 写的,为了达到运算速度,我们要求他只能装下一种类型,可以定义他只能装的数据类型。
放入初始化的 list 的时候可以同时指定装入的类型 x=np.array(lst,dtype=np.float) 指定数据类型的时候要以 np. 开头
查看全部 -
#encoding=utf-8 //编码方式
import numpy as np //引人numpy 并用np简化
def startMain(): //模板
pass
if _name_=="_main_‘’:
startMain()
查看全部 -
#常用array操作 list = (np.arange(1, 11)) #产生一个1-11(不含11)的等差数列 list = (np.arange(1, 11)).reshape([2, 5]) # 变成两行五列数组 print (np.exp(list)) # list 的自然指数 print (np.exp2(list)) # list 的自然指数的平方 print (np.sqrt(list)) # list 的开方 print (np.square(list)) # list 的平方 print (np.sin(list)) # list 的正弦值 print (np.log(list)) # list 的对数值 print (np.vstack((list1,list2))) #将两个数组分成两行组成一个数组也就是以行连接,注意传的是个tuple print (np.hstack((list1,list2))) #将两个数组相连组成一个一维数组,传的是tup print (np.split(list1,n)) #将数组 list1 切分成n个子数组 print (np.copy(list1)) #对数组进行拷贝
查看全部 -
print (np.zeros([2, 4]))#输出元素都为0的2行4列数组 print (np.ones([3, 5]))#输出元素都为1 的2行4列数组 print ("Rand:") print (np.random.rand(2, 4))#输出2行4列的随机数组 print (np.random.rand())#生成一个随机数 print (np.random.randint(1, 14, 5))#在1到14之间生成5个随机数 print (np.random.randn(2, 4))#输出2行4列标准正态分布随机数 print np.random.choice([10.20, 41])#在列表中的数随机选取一个 print (np.random.beta(1,10, 100))#生成一个1-10共100个beta数组
查看全部 -
np.array 用来创建一个numpy数组。 np.shape 显示np数组属性 np.ndim 表示数组维度 np.dtype表示数组元素类型(如:int8,in16,float64等) np.itemsize表示数组元素所占字节大小,如float64占字节8位 np.size表示数组元素个数
查看全部 -
使用python做数据分析,学工具查看全部
-
print(np.zeros[2,4]))#打印出2行4列的0
print(np.ones([3,5]))#打印出3行5列的1
print(“Rand:”)
print(np.random.rand(2,4))#0-1之间2行4列的随机数
print(np.random.rand())#不加参数只有一个随机数
print(“RandInt:”)
print(np.random.randint(1,10,3))范围1-10随机生成个3整数
print(“Randn:”)
print(np.random.randn(2,4))#标准正态布的两行四列的数
print(np.random.choice([10,20,30]))#三个数中选一个打印
print(“Distribute:”)
print(np.random.beta(1,10,100))#打印1-10中符合beta分布的100个数
h2 { margin-top: 0.19in; margin-bottom: 0.19in; direction: ltr; color: rgb(0, 0, 0); text-align: left; break-after: auto; }h2.western { font-family: "宋体", serif; }h2.cjk { font-family: "宋体"; }h2.ctl { font-family: "宋体"; font-weight: normal; }p { margin-bottom: 0.1in; direction: ltr; color: rgb(0, 0, 0); line-height: 115%; text-align: justify; }p.western { font-family: "Calibri", serif; font-size: 10pt; }p.cjk { font-family: "宋体"; font-size: 10pt; }p.ctl { font-size: 12pt; }a:link { color: rgb(0, 0, 255); }
查看全部 -
机器学习监督学习与无监督学习。机器学习的本质是一个函数。机器学习使用训练好的算法或者函数对历史数据进行处理,得出我们想要的结果。根据结果的不同,我们把机器学习分成以下几类
如果不在打标记的情况下得出的结果我们称之为无监督学习,如聚类和关联规则
如果提前进行打标记处理,那么就是监督学习。根据打标记的数据是离散的还是连续的,我们又进一步分为分类(结果是有限、离散的)和回归(结果是连续的)。数据挖掘和机器学习的一般步骤是数据预处理数据建模结果验证,这个工具包具体要结合自己的论文和实习进行整理。查看全部
举报