为了账号安全,请及时绑定邮箱和手机立即绑定

Python数据分析-基础技术篇

难度初级
时长 2小时42分
学习人数
综合评分8.40
77人评价 查看评价
9.0 内容实用
8.1 简洁易懂
8.1 逻辑清晰
  • #Set 对dataframe的属性进行设置 sl=pd.Series(list(range(10,18)),index=pd.date_range("20170301",periods=8)) df["F"]=s1 print (df) df.at[dates[0],"A"]=0 #将第0行A列的数值改为0 print (df) df.iat[1,1]=1 df.loc[:,D]=np.array([4]*len(df)) #将D列改为4? print(df) df2=df.copy() #拷贝dataframe df2[df2>0]=-df2 #将所有大于0的数改为负数 print(df2)
    查看全部
    0 采集 收起 来源:pandas基本操作

    2018-03-22

  • #select 选择数据 切片? print(type(df["A"])) #dataframe 其实是由一个个series组成的 print(df[:3]) #前三行 print(df["20170301":"20170304"]) #利用index进行切片 1号到4号 print(df.loc[dates[0]]) print(df.loc["20170301":"20170304","B","D"]) #1号到4号B列和D列的数据 print(df.at[dates[0],"C"]) #利用at表示特定值 dates[0]:1号 "C":C列 print(df.iloc[1:3,2:4]) #1到3不包括1,2到4不包括2 print(df.iloc[1,4]) #1行4列 print(df.iat[1,4]) print(df.[df.B>0][df.A<0])
    查看全部
    0 采集 收起 来源:pandas基本操作

    2018-03-22

  • #Basic print(df.head(3)) #head()打印出前几行 print(df.tail(3)) #tail()打印出后几行 print(df.index) #index()打印出索引 print(df.values) #values()打印出values print(df.T) #T 转置 print(df.sort(columns="C")) #第C列的values按从小到大的顺序排序 print(df.sort_index(axis=1,ascending=False)) #将index进行降序排序 print(df.describe()) #打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
    查看全部
    2 采集 收起 来源:pandas基本操作

    2018-03-22

  • import numpy as np import pandas as pd def main(): #Data Structure s=pd.Series([i*2] for i in range(1,11)) print(type(s)) dates=pd.date_range("20170301".periods=8) df=dataframe(np.random.randn(8,5)index索引=dates,coloums属性值=list('ABCDE')) print (df)
    查看全部
  • import numpy as np import matplotlib.pyplot as plt def run(): # line # -pai ~ pai之间,包含256个点,显示最后结束点 x = np.linspace(-np.pi, np.pi, 256, endpoint=True) # 定义余弦函数和正弦函数 c, s = np.cos(x), np.sin(x) # 绘图 plt.figure(1) plt.plot(x, c, color='blue', linewidth=1.0, linestyle='-', label="Cos", alpha=0.2) # r代表red,*代表线型 plt.plot(x, s, "r*", label="Sin") plt.title("Cos & Sin") # 显示坐标轴 # 轴的编辑器 ax = plt.gca() # spines 是四周的边线,none代表隐藏 ax.spines["right"].set_color("none") ax.spines["top"].set_color("none") # 位置设置到数据域的 0 位置 ax.spines["left"].set_position(("data", 0)) ax.spines["bottom"].set_position(("data", 0)) plt.show() if __name__ == '__main__': run()
    查看全部
    1 采集 收起 来源:基本线图绘制

    2018-03-22

  • def main(): from sklearn.datasets import load_iris iris = load_iris() print(iris) print(len(iris["data"])) from sklearn.model_selection import train_test_split train_data,test_data,train_target,test_target=train_test_split(iris.data,iris.target,test_size=0.2,random_state=1) from sklearn import tree #决策树 clf = tree.DecisionTreeClassifier(criterion="entropy") clf.fit(train_data,train_target) y_pred = clf.predict(test_data) #Verify from sklearn import metrics print(metrics.accuracy_score(y_true=test_target,y_pred=y_pred)) print(metrics.confusion_matrix(y_true=test_target,y_pred=y_pred)) with open("D:/test/test.xlsx","w") as f: tree.export_graphviz(clf,out_file=f) if __name__=="__main__": main()
    查看全部
  • # liner print(np.eye(3)) lst = np.array([ [1.,2.], [3.,4.] ]) # 单位矩阵 print("inv") print(inv(lst)) # 转置矩阵 print("Transpose") print(lst.transpose()) # 行列式 print("Det:") print(det(lst)) # 特征值和特征向量 print("eig:") print(eig(lst)) ''' 解方程: x + 2y = 5 3x + 4y = 7 解得: x = -3 y = 4 ''' y = np.array([[5.],[7.]]) print("solve:") print(solve(lst, y))
    查看全部
  • series&dataframe import numpy as np import pandas as pd def main() #data structure s=pd.Series([i*2 for i in range(1,11)]) print(type(s)) dates=pd.date_range('20170301',periods=8) df=pd.dataframe(np,random.randn(8,5),index组件,索引=datescolumns属性=list('ABCDE')) print (df)
    查看全部
  • 基础数据结构 基本操作 缺失值处理 统计与整合 时间 绘图 文件操作
    查看全部
    0 采集 收起 来源:认识pandas

    2017-10-29

  • numpy :数据结构基础 处理大型矩阵 scipy :强大的科学计算方法 matplotlib:可视化套件 pandas:基础的数据分析套件 scikit-learn:数据分析建模库 keras:人工神经网络
    查看全部
    0 采集 收起 来源:概述

    2017-10-29

  • 数据分析模块: numpy: 数据结构基础 scipy: 强大的科学计算方法(矩阵分析、信号分析、数理分析......) matplotlib: 丰富的可视化套件 pandas: 基础数据分析套件 scikit-learn: 强大的数据分析建模库 keras: 人工神经网络
    查看全部
    0 采集 收起 来源:概述

    2017-10-25

  • 绘图函数
    查看全部
    0 采集 收起 来源:基本线图绘制

    2017-10-24

  • bumpy:数据结构基础
    查看全部
    0 采集 收起 来源:概述

    2017-10-19

  • np.array 用来创建一个numpy数组。 np.shape 显示np数组属性 np.ndim 表示数组维度 np.dtype表示数组元素类型(如:int8,in16,float64等) np.itemsize表示数组元素所占字节大小,如float64占字节8位 np.size表示数组元素个数
    查看全部
    4 采集 收起 来源:ndarray

    2017-10-15

  • 第一课
    查看全部
    0 采集 收起 来源:概述

    2017-10-13

举报

0/150
提交
取消
课程须知
需要对python语法和基本数据结构有所了解,对数据分析感兴趣!
老师告诉你能学到什么?
1、数据分析的一般步骤 2、numpy简介与基本使用 3、matplotlib简介与基本使用 4、scipy简介与基本使用 5、pandas简介与基本使用 6、机器学习的一般概念 7、scikit-learn的简介、使用示例与学习方法 8、keras的简介与一般用法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!