常用的幾個經典Python模組

數據分析那些事
8 min readDec 5, 2023

--

Python常用的模組非常多,主要分為內建模組和第三方模組兩大類,且不同模組應用場景不同又可以分為文字類、資料結構類、數學運算類、檔案系統類、爬蟲類、網路通訊類等多個型別。

大家常用的內建模組比如:math、re、datetime、urllib、os、random等,第三方模組比如pandas、numpy、requests、matplotlib等。

來源:知乎@zhuweijun

什麼是Python模組?

模組是將複雜的、同一應用領域的功能程式碼進行封裝,你只需要呼叫介面,輸入相應引數,便可以輕鬆拿到結果,類似瑞士軍刀、萬能工具箱。

常用內建模組,約200多個

內建模組,顧名思義就是Python軟體內嵌的模組,無需額外安裝。

想要了解詳細的內建模組,最好去Python官網看,挺詳細的

你也可以在程式碼行輸入print(help(modules)),會顯示全部的內建模組

♦ 這裏舉幾個常用的內置模塊,並附上代碼:

「math 模組」

用來進行數學計算,它提供了很多數學方面的專業函式,適合科研、演算法

import math

# 計算平方根
sqrt_value = math.sqrt(25)
print("Square Root:", sqrt_value)

# 計算正弦值
sin_value = math.sin(math.radians(30))
print("Sine Value:", sin_value)

「re 模組」

正則表示式在Python中的擴充套件實現,該模組能支援正則表示式幾乎所有語法,對於文字處理來說必不可少

import re

# 查詢匹配的字串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)

「datetime 模組」

用於處理日期和時間,這個模組非常實用!!!

import datetime

# 獲取當前日期和時間
current_datetime = datetime.datetime.now()
print("Current Date and Time:", current_datetime)

# 格式化日期時間
formatted_datetime = current_datetime.strftime("%Y-%m-%d %H:%M:%S")
print("Formatted Date and Time:", formatted_datetime)

「urllib 模組」

用於進行網路請求,獲取網頁HTML,所謂的爬蟲就是這個模組

import urllib.request

# 發起HTTP GET請求
response = urllib.request.urlopen("https://www.example.com")
html = response.read()
print("HTML Content:", html[:100])

「os 模組」

提供了與作業系統互動的功能,比如檔案和目錄操作

import os

# 獲取當前工作目錄
current_dir = os.getcwd()
print("Current Directory:", current_dir)

# 列出目錄中的檔案和子目錄
files_and_dirs = os.listdir(current_dir)
print("Files and Directories:", files_and_dirs)

「random 模組」

用於生成偽隨機數

import random

# 生成隨機整數
random_integer = random.randint(1, 10)
print("Random Integer:", random_integer)

# 從列表中隨機選擇元素
random_element = random.choice(["apple", "banana", "cherry"])
print("Random Element:", random_element)

「json 模組」

專門用來處理 JSON 格式資料

import json

# 將字典轉換為 JSON 格式的字串
data = {"name": "Alice", "age": 25}
json_string = json.dumps(data)
print("JSON String:", json_string)

# 將 JSON 格式的字串轉換為字典
parsed_data = json.loads(json_string)
print("Parsed Data:", parsed_data)

「collections 模組」

提供了一些除list、dict之外有用的資料容器,比如 defaultdict、Counter 等

from collections import defaultdict, Counter

# 建立預設字典
word_counts = defaultdict(int)
words = ["apple", "banana", "apple", "cherry", "banana", "apple"]
for word in words:
word_counts[word] += 1
print("Word Counts:", word_counts)

# 統計元素出現的次數
element_counts = Counter(words)
print("Element Counts:", element_counts)

「csv 模組」

專門用於處理逗號分隔值(CSV)檔案

import re

# 查詢匹配的字串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)

「sys 模組」

提供了與Python直譯器互動的功能,例如訪問命令列引數

mport sys

# 獲取命令列引數
arguments = sys.argv
print("Command-line Arguments:", arguments)

常用的第三方模組,十幾萬個

Python之所以這麼受歡迎,很大一部分原因得益於強大的第三方工具生態,幾乎各個領域都有對應的模組可以使用。

比如:

  • 資料科學領域:pandas、numpy、scipy、sympy
  • 視覺化領域:matplotlib、seaborn、plotly、bokeh、pyecharts
  • 機器學習領域:scikit-learn、keras、Tensorflow
  • 大資料領域:pyspark、pyflink
  • 爬蟲領域:requests、scrapy、bs4
  • 金融量化領域:ta-lib、zipline、pyfolio

其他各領域都有相應的模組可以使用,這裡就不一一列舉

總得來說,Python常用的模組非常多,還是要根據你的使用場景來選擇,大家可以去Python官網、github上找相應的模組及教程。

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

27 個Python資料科學庫實戰案例 (附程式碼)

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

回顧十週入門數據分析系列文:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/