数据可视化 第2章



  • 第2章 过滤数据

    1.transform_date函数把utc格式时间转换为QDateTime类型

    def transform_date(utc, timezone=None):
        utc_fmt = "yyyy-MM-ddTHH:mm:ss.zzzZ"
        new_date = QDateTime().fromString(utc, utc_fmt)
    #    print (new_date.toString(utc_fmt))
        if timezone:
            new_date.setTimeZone(timezone)
    
        return new_date
    

    2.drop函数过滤数据,mag<0的行都被删除

    #移除错误的mag
        df = df.drop(df[df.mag < 0].index)
        magnitudes = df["mag"]
    

    3.创建本地时区

    #本地时区
        timezone = QTimeZone(b"Asia/Beijing")
    

    4.apply方法能支持lambda表达式,能把函数应用到每行数据上,我们提取time列数据,转换为QDateTime类型

    #将时间戳转换为本地时区
        times = df["time"].apply(lambda x: transform_date(x, timezone))
    
    

    5.完整代码

    # This Python file uses the following encoding: utf-8
    import sys, argparse
    import pandas as pd
    from PySide2.QtCore import QDateTime, QTimeZone
    
    
    def transform_date(utc, timezone=None):
        utc_fmt = "yyyy-MM-ddTHH:mm:ss.zzzZ"
        new_date = QDateTime().fromString(utc, utc_fmt)
    #    print (new_date.toString(utc_fmt))
        if timezone:
            new_date.setTimeZone(timezone)
    
        return new_date
    
    def read_data(fname):
        df = pd.read_csv(fname)
    
        #移除错误的mag
        df = df.drop(df[df.mag < 0].index)
        magnitudes = df["mag"]
    
        #本地时区
        timezone = QTimeZone(b"Asia/Beijing")
    
        #将时间戳转换为本地时区
        times = df["time"].apply(lambda x: transform_date(x, timezone))
    
        return times, magnitudes
    
    
    if __name__ == "__main__":
        options = argparse.ArgumentParser()
        options.description = "过滤csv信息"
        options.add_argument("-f", "--file", type=str, required=True, help="CSV文件路径")
        args = options.parse_args()
        data = read_data(args.file)
        print (data)
    
    

    6.控制台输出log

    (0     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 18, 4...
    1     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 10, 1...
    2     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 7, 3,...
    3     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 6, 4,...
    4     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 5, 43...
    5     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 4, 57...
    6     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 4, 27...
    7     PySide2.QtCore.QDateTime(2019, 7, 24, 9, 1, 27...
    8     PySide2.QtCore.QDateTime(2019, 7, 24, 8, 54, 5...
    9     PySide2.QtCore.QDateTime(2019, 7, 24, 8, 54, 1...
    10    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 53, 2...
    11    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 52, 2...
    12    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 50, 1...
    13    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 49, 1...
    14    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 48, 4...
    15    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 47, 3...
    16    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 46, 5...
    17    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 44, 5...
    18    PySide2.QtCore.QDateTime(2019, 7, 24, 8, 44, 0...
    Name: time, dtype: object, 0     1.37
    1     0.49
    2     1.43
    3     2.73
    4     2.04
    5     1.44
    6     1.23
    7     0.75
    8     1.22
    9     1.20
    10    0.92
    11    1.67
    12    1.50
    13    1.20
    14    1.02
    15    1.51
    16    1.41
    17    0.87
    18    0.91
    Name: mag, dtype: float64)
    


  • @青山白云 Python在数据分析领域还是大放异彩的。


Log in to reply
 

走马观花

最近的回复

  • 113.jpg
    1、什么是lambda表达式,什么是闭包?
    lambda表达式即lambda函数,也就是匿名函数。

    lambda表达式在C++中包含了
    []表示捕获
    ()是函数的参数,需要指定类型
    ->type是返回的类型,可以省略,如果编译器无法推出类型的话可以强制编写
    {}是函数体。

    lambda可以被声明为mutable的,作用是将捕获的内容进行改变。
    闭包是函数的定义以及定义函数时提供的环境,总称为闭包。lambda函数也是一种闭包。
    lambda本身是匿名函数,而捕获语句则是提供了定义函数时提供的环境。

    2、什么是右值引用?
    右值引用相对与左值引用而言的。左值即=运算符左边的变量,右值是=运算符右边的常量或变量。由此可以看出,
    右值引用指的是对常量或变量的引用。它的用途包含了移动语义和完美转发。
    移动语义就是弥补了C++历史在处理变量传递时丢失的一种语义。它和值传递、引用传递一样,是变量传递的方式之一。
    如果没有移动语义,为了将一个类的实例传递给另外一个实例,就需要额外地进行构造、赋值、销毁的操作。
    对于一些比较复杂的变量,的确是非常耗时并且消耗大的操作。(浪费指令时间、浪费内存)

    对于这样的函数返回:
    vector<string> str_split(const string& s) {
    vector<string> v;
    // ...
    return v; // v是左值,但优先移动,不支持移动时仍可复制。
    }

    标准要求先调用移动构造函数,如果不符合那么再调用拷贝构造函数。所以可以轻松地写出这种写法而不必担心效率问题。
    同时,现代编译器都会对返回值进行优化,成为RVO以及NRVO。所以不用太担心会多调用构造析构函数。

    对于完美转发,C++对于引用的转发有规则。传统的C++是无法对引用进行再引用的。但是现代的C++放宽了它的使用范围。
    只有右引用右值的时候,才会产生右引用。这也称为引用折叠。

    3、auto关键字的作用是什么?
    auto关键字为的是能够让编译器自动推导类型。自C++98之后,编译器对类型的推导变得越来越智能了。
    而我们在编写复杂代码的时候,冗长的类型不仅容易出错,有时也不容易人工推导出类型。
    因此auto可以简化我们的任务量,让类型的推导交给编译器完成。
    除了auto外,我们还可以使用decltype()来让编译器推导类型。

    read more
  • 我感觉比起《Physically Based Rendering Technique》,还是《Ray Tracing in a Weekend》更容易上手,因为慢慢地能够做出一个渲染效果,这个是有成就感的。🎓

    read more
  • G

    北京名律免费法律咨询,解决您的法律困扰,如果您眼下没有遇到法律上的问题,也可以留一位大律师的联系方式以备不时之需!ccfd91efc3a6b2ed0e79054d2248eed.jpg bf6015b383483f1fe83cdcfd130fc6b.jpg 2f347879129add1096bf3424edbe517.jpg

    read more

关注我们

微博
QQ群