溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python數(shù)據(jù)分析過程是怎樣的

發(fā)布時間:2022-01-10 14:24:34 來源:億速云 閱讀:160 作者:iii 欄目:開發(fā)技術(shù)

這篇文章主要介紹“Python數(shù)據(jù)分析過程是怎樣的”的相關(guān)知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強(qiáng),希望這篇“Python數(shù)據(jù)分析過程是怎樣的”文章能幫助大家解決問題。

    一、需求介紹

    該需求主要是分析某一種數(shù)據(jù)的歷史數(shù)據(jù)。

    客戶的需求是根據(jù)該數(shù)據(jù)的前兩期的情況,如果存在某個斜著的兩個數(shù)字相等,那么就買第三期的同一個位置處的彩票,
    對于1、,如果相等的數(shù)字是:1-5,那就買6-10,如果相等的數(shù)字是:6-10,那就買1-5;
    對于2、,如果相等的數(shù)字是:1-5,那就買1-5,如果相等的數(shù)字是:6-10,,那就買6-10。

    然后,根據(jù)這個方案,有可能會買中,但是也有可能買不中,于是,客戶希望我可以統(tǒng)計出來在100天中,按照這種方法,連續(xù)6次以及6次以上的購買彩票才能夠命中一次獎的次數(shù)以及分別所對應(yīng)的時間,對于這個案例,我們下面詳細(xì)分析。

    二、以第1、個為例進(jìn)行數(shù)據(jù)分析

    (在這里,我們先利用 Jupyter Notebook 來進(jìn)行分析,然后,在得到成果以后,利用 Pycharm 來進(jìn)行完整的程序設(shè)計。)

    1、獲取一天的數(shù)據(jù)

    打開如下圖所示的界面可以獲取到網(wǎng)址以及請求頭:
    1、網(wǎng)址(歷史數(shù)據(jù)的網(wǎng)址)

    Python數(shù)據(jù)分析過程是怎樣的

    2、請求頭

    Python數(shù)據(jù)分析過程是怎樣的

    然后我們在程序中進(jìn)行代碼書寫獲取數(shù)據(jù):

    Python數(shù)據(jù)分析過程是怎樣的

    Python數(shù)據(jù)分析過程是怎樣的

    然后進(jìn)行一定的預(yù)處理:

    Python數(shù)據(jù)分析過程是怎樣的

    2、開始一天的數(shù)據(jù)的分析

    這里我們直接展示代碼:

    def reverse_list(lst):
        """
        準(zhǔn)換列表的先后順序
        :param lst: 原始列表
        :return: 新的列表
        """
        return [ele for ele in reversed(lst)]
    low_list = ["01", "02", "03", "04", "05"]
    # 設(shè)置比較小的數(shù)字的列表
    high_list = ["06", "07", "08", "09", "10"]
    # 設(shè)置比較大的數(shù)字的列表
    N = 0
    # 設(shè)置一個數(shù)字N來記錄一共有多少期可以購買
    n = 0
    # 設(shè)置一個數(shù)字n來記錄命中了多少期彩票
    record_number = 1  
    # 設(shè)置記錄數(shù)據(jù)的一個判斷值
    list_data_number = []
    # 設(shè)置一個空的列表來存儲一天之中的連續(xù)掛掉的期數(shù)
    dict_time_record = {}
    # 設(shè)置一個空的字典來存儲連掛掉的期數(shù)滿足所列條件的時間節(jié)點
    for k in range(1152):  
        # 循環(huán)遍歷所有的數(shù)據(jù)點
        if k < 1150:
            new_result1 = reverse_list(new_response["result"]["data"])[k]  
            # 第一期數(shù)據(jù)
            new_result2 = reverse_list(new_response["result"]["data"])[k + 1]  
            # 第二期數(shù)據(jù)
            new_result3 = reverse_list(new_response["result"]["data"])[k + 2]  
            # 第三期數(shù)據(jù)
            data1 = new_result1['preDrawCode'].split(',')
            # 第一期數(shù)據(jù)
            data2 = new_result2['preDrawCode'].split(',')
            # 第二期數(shù)據(jù)
            data3 = new_result3['preDrawCode'].split(',')
            # 第三期數(shù)據(jù)
            for m in range(10):
                # 通過循環(huán)來判斷是否滿足購買的條件,并且實現(xiàn)一定的功能
                if m == 0:
                    if data2[0] == data1[1]:  
                        # 如果相等就要結(jié)束循環(huán)
                        N += 1
                        # 可以購買的期數(shù)應(yīng)該要自加一
                        if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list):
                            n += 1
                            # 命中的期數(shù)應(yīng)該要自加一
                            # 如果命中了的話,本輪結(jié)束,開啟下一輪
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                # 如果已經(jīng)有了這個鍵,那么值添加時間點
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                # 如果沒有這個鍵,那么添加一個鍵值對,值為一個列表,而且初始化為當(dāng)前的時間
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            record_number = 1  
                            # 初始化下一輪的開始
                        else:
                            record_number += 1  
                            # 如果沒有命中的話,次數(shù)就應(yīng)該要自加一
                        break  
                        # 如果滿足相等的條件就要結(jié)束循環(huán)
                elif m == 9:  
                    # 與上面差不多的算法
                    if data2[9] == data1[8]:  
                        # 如果相等
                        N += 1
                        if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            record_number = 1
                        else:
                            record_number += 1
                        break
                else:  
                    # 與上面差不多的算法
                    if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:  
                        # 如果相等
                        N += 1
                        if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            record_number = 1
                        else:
                            record_number += 1
                        break
    print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數(shù)為{N}個,一共有{n}次命中,一共有{N - n}次掛了")
    # 打印時間,以及,可以購買的期數(shù),命中的期數(shù),沒有命中的期數(shù)
    list_data_number.sort()
    # 按照大小順序來進(jìn)行排序
    dict_record = {}
    # 設(shè)置空字典進(jìn)行記錄
    for i in list_data_number:
        if f"{i}" in dict_record.keys():  # 判斷是否已經(jīng)有了這個數(shù)字?
            dict_record[f"{i}"] += 1
            # 如果有的話,那么就會自加一
        else:  # 如果沒有的話,那么就會創(chuàng)建并且賦值等于 1
            dict_record[f"{i}"] = 1
            # 創(chuàng)建一個新的字典元素,然后進(jìn)行賦值為 1
    for j in dict_record.keys():
        if (int(j) >= 6) and (int(j) < 15):
            # 實際的結(jié)果表明,我們需要的是大于等于6期的數(shù)據(jù),而沒有出現(xiàn)大于15的數(shù)據(jù),因此有這樣的一個關(guān)系式
            print(f"買{j}次才中獎的次數(shù)為{dict_record[j]}")
            # 打印相關(guān)信息
            print(dict_time_record[j])
            str0 = ""
            for letter in dict_time_record[j]:
                str0 += letter
                str0 += ", "
            print(str0)
            # 打印相關(guān)信息

    運行結(jié)果的展示如下圖所示:

    Python數(shù)據(jù)分析過程是怎樣的

    3、循環(huán)日期進(jìn)行多天的數(shù)據(jù)分析:

    首先設(shè)置一個事件列表來記錄需要統(tǒng)計哪些天的數(shù)據(jù):
    代碼:

    data_list = []
    for h in range(31):
        data_list.append(f'1-{h + 1}')
    for h in range(28):
        data_list.append(f'2-{h + 1}')
    for h in range(31):
        data_list.append(f'3-{h + 1}')
    for h in range(20):
        data_list.append(f'4-{h + 1}')

    通過上述的代碼,我們即實現(xiàn)了時間列表的設(shè)置,然后我們循環(huán)遍歷這個列表訪問不同日期的彩票數(shù)據(jù)即就是得到了不同時間的數(shù)據(jù),然后再利用上述的分析方法來進(jìn)行數(shù)據(jù)分析,即就是可以得到了多天的彩票數(shù)據(jù)分析的結(jié)果了。

    4、將數(shù)據(jù)寫入Excel表格中

    這里我們可以采用xlwt 模塊來進(jìn)行excel表格的寫入操作啦,具體的寫入就不必過多贅述了。

    三、完整的代碼展示:

    一下是完整的代碼:

    import requests
    import chardet
    import json
    import xlwt  # excel 表格數(shù)據(jù)處理的對應(yīng)模塊
    def reverse_list(lst):
        """
        準(zhǔn)換列表的先后順序
        :param lst: 原始列表
        :return: 新的列表
        """
        return [ele for ele in reversed(lst)]
    data_list = []
    for h in range(31):
        data_list.append(f'1-{h + 1}')
    for h in range(28):
        data_list.append(f'2-{h + 1}')
    for h in range(31):
        data_list.append(f'3-{h + 1}')
    for h in range(20):
        data_list.append(f'4-{h + 1}')
    wb = xlwt.Workbook()  # 創(chuàng)建 excel 表格
    sh = wb.add_sheet('彩票分析數(shù)據(jù)處理')  # 創(chuàng)建一個 表單
    sh.write(0, 0, "日期")
    sh.write(0, 1, "梯子數(shù)目")
    sh.write(0, 2, "命中數(shù)目")
    sh.write(0, 3, "掛的數(shù)目")
    sh.write(0, 4, "6次中的數(shù)目")
    sh.write(0, 5, "6次中的時間")
    sh.write(0, 6, "7次中的數(shù)目")
    sh.write(0, 7, "7次中的時間")
    sh.write(0, 8, "8次中的數(shù)目")
    sh.write(0, 9, "8次中的時間")
    sh.write(0, 10, "9次中的數(shù)目")
    sh.write(0, 11, "9次中的時間")
    sh.write(0, 12, "10次中的數(shù)目")
    sh.write(0, 13, "10次中的時間")
    sh.write(0, 14, "11次中的數(shù)目")
    sh.write(0, 15, "11次中的時間")
    sh.write(0, 16, "12次中的數(shù)目")
    sh.write(0, 17, "12次中的時間")
    sh.write(0, 18, "13次中的數(shù)目")
    sh.write(0, 19, "13次中的時間")
    sh.write(0, 20, "14次中的數(shù)目")
    sh.write(0, 21, "14次中的時間")
    # wb.save('test4.xls')
    sheet_seek_position = 1
    # 設(shè)置表格的初始位置為 1
    for data in data_list:
        low_list = ["01", "02", "03", "04", "05"]
        high_list = ["06", "07", "08", "09", "10"]
        N = 0
        n = 0
        url = f'https://api.api68.com/pks/getPksHistoryList.do?date=2021-{data}&lotCode=10037'
        headers = {
            'User-Agent':
                'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                'AppleWebKit/537.36 (KHTML, like Gecko) '
                'Chrome/90.0.4430.72 Safari/537.36'
        }
        response = requests.get(url=url, headers=headers)
        response.encoding = chardet.detect(response.content)['encoding']
        new_response = json.loads(response.text)
        sh.write(sheet_seek_position, 0, new_response['result']['data'][0]['preDrawTime'][:10])
        # 在表格的第一個位置處寫入時間,意即:data
        record_number = 1  # 記錄數(shù)據(jù)的一個判斷值,設(shè)置為第一次,應(yīng)該是要放在最外面的啦
        list_data_number = []
        # 設(shè)置一個空列表來存儲一天之中的連續(xù)掛的期數(shù)
        dict_time_record = {}
        for k in range(1152):
            # record_number = 1,應(yīng)該要放外面
            # 記錄數(shù)據(jù)的一個判斷值,設(shè)置為第一次
            if k < 1150:
                new_result1 = reverse_list(new_response["result"]["data"])[k]
                new_result2 = reverse_list(new_response["result"]["data"])[k + 1]
                new_result3 = reverse_list(new_response["result"]["data"])[k + 2]
                data1 = new_result1['preDrawCode'].split(',')
                data2 = new_result2['preDrawCode'].split(',')
                data3 = new_result3['preDrawCode'].split(',')
                for m in range(10):
                    if m == 0:
                        if data2[0] == data1[1]:
                            N += 1
                            if (data2[0] in low_list and data3[0] in high_list) or (data2[0] in high_list and data3[0] in low_list):
                                n += 1
                                # 如果命中了的話,本輪結(jié)束,開啟下一輪
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1  # 初始化
                            else:
                                record_number += 1  # 沒中,次數(shù)加一
                                # 自加一
                            break
                    elif m == 9:
                        if data2[9] == data1[8]:
                            N += 1
                            if (data2[9] in low_list and data3[9] in high_list) or (data2[9] in high_list and data3[9] in low_list):
                                n += 1
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1
                            else:
                                record_number += 1
                            break
                    else:
                        if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:
                            N += 1
                            if (data2[m] in low_list and data3[m] in high_list) or (data2[m] in high_list and data3[m] in low_list):
                                n += 1
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1
                            else:
                                record_number += 1
                            break
        print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數(shù)為{N}個,一共有{n}次命中,一共有{N - n}次掛了")
        sh.write(sheet_seek_position, 1, N)
        sh.write(sheet_seek_position, 2, n)
        sh.write(sheet_seek_position, 3, N - n)
        # new_list_data_number = list_data_number.sort()
        list_data_number.sort()
        # 進(jìn)行排序
        dict_record = {}
        # 設(shè)置空字典
        for i in list_data_number:
            if f"{i}" in dict_record.keys():  # 判斷是否已經(jīng)有了這個數(shù)字?
                dict_record[f"{i}"] += 1
                # 如果有的話,那么就會自加一
            else:  # 如果沒有的話,那么就會創(chuàng)建并且賦值等于 1
                dict_record[f"{i}"] = 1
                # 創(chuàng)建一個新的字典元素,然后進(jìn)行賦值為 1
        # print(dict_record)
        # print(f"買彩票第幾次才中獎?")
        # print(f"按照我們的規(guī)律買彩票的情況:")
        for j in dict_record.keys():
            if (int(j) >= 6) and (int(j) < 15):
                print(f"買{j}次才中獎的次數(shù)為{dict_record[j]}")
                print(dict_time_record[j])
                str0 = ""
                for letter in dict_time_record[j]:
                    str0 += letter
                    str0 += ", "
                print(str0)
                sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2, dict_record[j])
                # 寫入幾次
                sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2 + 1, str0[:-2])  
                # 注意這里應(yīng)該要改為 -2
                # 寫入幾次對應(yīng)的時間
                # print(j)
        sheet_seek_position += 1
        # 每次寫完了以后,要對位置進(jìn)行換行,換到下一行,從而方便下一行的寫入
    # 保存
    wb.save('極速飛艇彩票分析結(jié)果.xls')

    運行結(jié)果展示:
    展示1、

    Python數(shù)據(jù)分析過程是怎樣的

    展示2、

    Python數(shù)據(jù)分析過程是怎樣的

    從而,我們便解決了極速飛艇的彩票的數(shù)據(jù)分析

    然后,我們只需要稍稍改變一點點算法,其他的部分是完全一樣的啦,從而即就是可以實現(xiàn)極速賽車的數(shù)據(jù)分析了啦。
    修改的代碼在下面列出來了:

     for m in range(10):
                    if m == 0:
                        if data2[0] == data1[1]:
                            N += 1
                            if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list):
                                n += 1
                                # 如果命中了的話,本輪結(jié)束,開啟下一輪
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1  # 初始化
                            else:
                                record_number += 1  # 沒中,次數(shù)加一
                                # 自加一
                            break
                    elif m == 9:
                        if data2[9] == data1[8]:
                            N += 1
                            if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list):
                                n += 1
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1
                            else:
                                record_number += 1
                            break
                    else:
                        if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:
                            N += 1
                            if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list):
                                n += 1
                                list_data_number.append(record_number)
                                if f"{record_number}" in dict_time_record.keys():
                                    dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                                else:
                                    dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                                # print(record_number)
                                record_number = 1
                            else:
                                record_number += 1
                            break

    關(guān)于“Python數(shù)據(jù)分析過程是怎樣的”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識,可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會為大家更新不同的知識點。

    向AI問一下細(xì)節(jié)

    免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

    AI