Pythonの変数には、ローカル変数とグローバル変数があります。
ローカル変数は、関数の中で代入が行われた変数です。一方グローバル変数は、関数の外で代入が行われた変数です。
次のソースコードにおいて、local_varがローカル変数、global_varがグローバル変数となります。
global_var = 10 # グローバル変数
def func():
local_var = 100 # ローカル変数
if global_var == 10: # グローバル変数は通常、関数内では参照のみ可
print(local_var)
グローバル変数は通常、関数内では参照しかできず、更新することはできません。しかしglobalキーワードを使えば、関数内で値の変更ができるようになります。
global_var = 100 # グローバル変数
def func():
global global_var # globalキーワードを使用
local_var = 100 # ローカル変数
print(local_var)
global_var = True # 関数内での更新も可能になる
ここでは、グローバル変数について着目します。
グローバル変数はどの関数からでも参照・更新ができるので、一見便利であるような気もします。しかし、グローバル変数は上手に使わないと、プログラムがとても複雑で分かりにくいものになってしまいます。
グローバル変数はどこでも参照・更新ができるため、プログラム全体を見ないと使い方が分かりません。
新しく作った関数でグローバル変数を更新すると、同じグローバル変数を使った他の関数や、関数外の処理など、すべてに影響が生じてしまします。この影響が問題ないのか、プログラム全体を確認しなければいけません。
また、次の例を見てみましょう。何が起きているか、分かるでしょうか。
global_var = 100
def func1():
print(global_var)
def func2():
print(global_var)
global_var = 200
print("func1を実行")
func1()
print("func2を実行")
func2()
func1()では、グローバル変数を参照して値を画面に出力しています。これは特に問題ないでしょう。
一方、func2()は、「ローカル変数global_varを、割り当てる前に参照している」としてエラーになっています。
Pythonでは、関数の中で代入が行われた変数はローカル変数になります。やっかいなのは、「どこで代入したとしても、関数内の同名の変数はすべてローカル変数になる」ということです。func2()は、最後にglobal_varへ代入を行っていることから、print関数に指定しているglobal_varもローカル変数になってしまっているのです。
このようなごく短い関数であれば間違いを見つけることは難しくありませんが、ある程度大きな関数でこのようなことが起こってしまったとき、問題を見つけるのに苦労してしまうかもしれません。
これまでグローバル変数のネガティブな面を見てきましたが、絶対に使ってはいけないということはありません。特に「プログラム全体で横断的に使用する、不変の定数」は、グローバル変数を使うとよいです。
なおそのような「プログラム全体で横断的に使用する、不変の定数」は、定数として使用するので、一度定義したら値を変更してはいけません。
ただしPythonには、他のプログラム言語のように値の変更を防ぐ仕組みがありません。そのため慣例的に、定数として用いる変数は変数名をすべて大文字として、定数であることが分かりやすくなるようにします。例を次に示します。
FIGIRE_PATH = "/data/figure"
逆に、このような定数をハードコーディングしたり、関数の引数で受け渡しをして複雑な作りにしてしまったりといったことは、避けるようにしてください。
Pythonプログラムを作成するにあたり、長大な処理を、上から下へダラダラと記述していくようなプログラムは、好ましくありません。きちんと関数を作って、見通しの良いプログラムを作ることが必須となります。
ですが、関数の構文を学んでも、それを上手に使うのにはコツがあります。ここでは、関数をどのような観点で作成すればよいのか、その勘所をご紹介します。
プログラム中で同じ処理が何度も出てくると、冗長で読みづらくなります。また、処理が間違っていて修正する際に、あちこちを修正する必要があり、修正漏れのリスクが生じてしまいます。
それでは、1度しか行われない処理は関数にする必要がないかというと、そうとは限りません。ある程度大きなプログラムであれば、それが1度しか行われない処理であっても、機能ごとに関数を作成してください。これによるメリットは、次のとおりです。
また、一つの関数に複数の機能をまぜるのも避けてください。「1つの機能は1つの関数に」が原則です。
きれいに機能ごとに関数を作ることができたら、プログラムスタート時のメイン処理は、関数が列挙されたのみの状態となることが理想です。
イメージを次に示します。
def init():
""" 初期化関数 """
:
def read_data():
""" データ読み込み関数 """
:
df process_data()
""" データ処理関数 """
:
def output_data()
""" データ出力関数 """
:
# メイン処理
init()
read_data()
process_data()
output_data()
このような形になれば、メイン処理を見るとプログラムの大きな流れを容易につかむことができます。
例えばデータ処理のソースコードを見たいと思ったときに、どこを見ればよいのかが一目で分かりますので、とても読みやすく、修正もしやすいコードとなります。
ARIM事業でも、このような関数の作り方をコーディング規則として定めており、誰が見ても分かりやすいコードとなるようにしています。
Pythonプログラムの少し高度な機能として、クラスがあります。
クラスに限った話ではありませんが、その機能が何のために存在しているのか、どんなメリットがあるのかを理解せずに使用しても意味がありません。
特にクラスについては、使いどころが少し難しく、適切な使い方ができていないことも多いです。よく見られる例としては、処理の共通化や汎用化のためだけに、クラスを使っている事例です。このような目的のみであれば、関数化や、モジュール(.pyファイル)の分割で十分であることがほとんどです。
ここでは、クラスの特徴をごくごく簡単にご説明します。クラスを使おうと考えたとき、本当にクラスにするのが最適なのか、考える材料にしていただければと思います。
クラスについて学ぶと、クラスとインスタンスという言葉が必ず登場します。クラスは製品の設計図、インスタンスは設計図を元に生産された製品、と例えられることが多いです。
例えば、「車」クラスという設計図あって、その設計図をもとに「田中さんの赤い乗用車」インスタンスや、「鈴木さんの白いトラック」インスタンスという具体的な製品が作られます。これらは持ち主、色、モデルこそ違いますが、「ドアを開ける」「走る」といった共通の機能を持っています。
実際のソースコードを見てみましょう。
class Car:
def __init__(self, owner, color, model):
self.owner = owner
self.color = color
self.model = model
def open(self):
print(f"{self.owner}さんの{self.color}の{self.model}のドアが開いた!")
def run(self):
print(f"{self.owner}さんの{self.color}の{self.model}が走った!")
red_car = Car("田中", "赤", "乗用車")
red_car.open()
red_car.run()
print("-"*50)
white_car = Car("鈴木", "白", "トラック")
white_car.open()
white_car.run()
持ち主、色、モデルが違っても、車クラスのインスタンスにすれば「初期化する」「ドアを開ける」「走る」といった機能が共通化されるので、プログラムの理解・作成がとてもやりやすくなります。
また、ドアを開ける機能を修正したいときに、openメソッドを変更すれば全ての車のインスタンスに変更が適用されるので、乗用車は修正されたけど、トラックは修正されなかった!といった修正ミスが少なくなります。
車だけでなく、同じ「乗り物」である「飛行機」も考えてみましょう。
「持ち主」「色」「モデル」という属性は、車であっても飛行機であっても必要な情報です。「ドアを開ける」という機能も共通でしょう。
一方、車は「走る」ですが、飛行機は「飛ぶ」という機能の方が適切です。
このようなとき、「乗り物」というクラスを作って「持ち主」「色」「モデル」という属性や、「ドアを開ける」という機能を定義します。また、「走る」「飛ぶ」を抽象的に表す「動く」という機能を定義しておきます。
この「乗り物」を継承して「車」「飛行機」というクラスを作り、「動く」が呼ばれたときには、車クラスであれば「走る」、飛行機クラスであれば「飛ぶ」ようにしてあげることができます。これには、メソッドのオーバーライドと呼ばれる機能を使います。
実際のソースコードを見てみましょう。
class Machine:
def __init__(self, owner, color, model):
self.owner = owner
self.color = color
self.model = model
def open(self):
print(f"{self.owner}さんの{self.color}の{self.model}のドアが開いた!")
def move(self):
# 「走る」「飛ぶ」など様々な乗り物が動く機能を抽象化する
print(f"{self.owner}さんの{self.color}の{self.model}が動いた!")
class Car(Machine):
def move(self):
# Machineクラスのmoveを上書きして「走る」にする
print(f"{self.owner}さんの{self.color}の{self.model}が走った!")
class Airplane(Machine):
def move(self):
# Machineクラスのmoveを上書きして「飛ぶ」にする
print(f"{self.owner}さんの{self.color}の{self.model}が飛んだ!")
red_car = Car("田中", "赤", "乗用車")
red_car.open()
red_car.move()
print("-"*50)
blue_airplane = Airplane("佐藤", "青", "ヘリ")
blue_airplane.open()
blue_airplane.move()
このように、抽象的なクラスから具体的なクラスへと継承することで、「車」「飛行機」という異なる種類の乗り物であっても、共通の属性や操作は統合して一か所に定義することができます。
クラスの特徴・メリットは、「カプセル化」など他にもあります。
クラスの説明はどうしても難しくなってしまうため、データ構造化よりも身近な例で、簡単に特徴をご紹介しました。
これらの特徴を生かせる使い方であるかどうか、十分に検討して、クラスを乱用しないように気を付けてください。
Pythonのエラーには、構文エラーと例外があります。例外については、「この例外が起きたら、こうする」というのをプログラマが自由に決めることができます。例外は、次のようなtry~exceptを使って処理します。
try:
例外が発生する可能性のある処理
except 発生しうる例外1 as 例外オブジェクト1
例外1が発生したときの処理
except 発生しうる例外2 as 例外オブジェクト2
例外2が発生したときの処理
:
else:
例外が発生しなかったときだけ動く処理
finally:
例外が起きても起きなくても必ず動く処理
入門書などでは、次のようなプログラム例をよく見かけます。
try:
divval = 0
print(100/divval)
except ZeroDivisionError:
print("ZeroDivisionErrorが発生しました")
try:
idx = 10
mylist = ["Tokyo", "Osaka", "Nagoya"]
print(mylist[idx])
except IndexError:
print("IndexErrorが発生しました")
try文の機能だけに着目して、分かりやすいように簡単なプログラムとしていると思われますが・・・。実際には、このような例外処理を書くことはお勧めしません。
例外処理の上手な書き方として、次のような観点に着目してください。
事前にif文でチェックできたり、そもそも例外が発生しないようプログラムを記述できたりするエラーは、「想定可能な事象」とえいます。このような事象は、例外で処理しないことをお勧めします。
ZeroDivisionErrorが想定されるケースでは、割る数が0でないかを事前にif文でチェックできます。0であったときは割り算せずに、結果を他の値で代替するなど、プログラムを止めずに続行できることも多いでしょう。
IndexErrorは、そもそもプログラムを正しく記述していれば、発生することはほぼないと言えるでしょう。
例外処理は、if文でのチェックが難しかったり、プログラムの修正では対処できないような事象でのみ行うことをお勧めします。例えば、openでファイルを開くときのことを考えてみます。このとき、たとえば次のような例外が発生することが考えられます。
これらすべてをif文でチェックするのは大変ですし、すべてのエラーに対応できているかはPythonに精通していないと判断が難しいでしょう。
またそれ以前の問題として、仮にif文ではすべてのエラーをチェックできたとしても、if文でチェックしてからopenで開くまでの間に、ファイルを削除されたり、アクセス権を外されてしまうかもしれません。つまりそもそも、if文のチェックでは完全にこれらのエラーに対処できないのです。
こういったケースでtry文を使えば、確実にエラーに対処できます。ファイルオープンに関連するエラーはOSErrorという例外1つで処理することができるため、エラー対処に漏れがなく、シンプルなプログラムになります。
try:
with open("dummy", "r") as f:
print(type(f))
except OSError as e:
print("OSError: " + str(e))
決してやってはいけない例外の使い方は、「何か例外が起きるけど、よく分からないからpassして動かしちゃえ!」という使い方です。極端なプログラムとして、下記のようなものがあります。
try:
例外が発生する可能性のある処理1
例外が発生する可能性のある処理2
:
except Exception:
pass
継続処理
このプログラムはどんな例外が起こっても、無視してプログラムが継続します。しかし、もし例外が起きていたら、プログラムが期待通りの動作をしたという保証はありません。
上記のようなプログラムにはせず、例外が発生したらきちんと調査をして、exceptで適切な処理をしてください。もちろん、調査した結果、無視してよいと確認できたのであれば、passを使っても問題ありません。
データ構造化プログラムにおいては、様々な計測データなどをファイルから入力し、構造化されたデータをファイルに出力することになります。そのため、まさに「例外で処理すべき事例」でご紹介したopenの例が該当します。
また、入力ファイルが正しいという保証がないので、いざオープンに成功しても、読み込んでみないとどんなデータが来るのか分からず、どんな例外が発生するかもあらかじめ想定することは出来ないでしょう。
データ構造化プログラムでは、ぜひ例外処理を活用してください。ARIM事業のデータ構造化プログラムでは、次のようにメインの処理全体をtry文で囲み、例外が起きたらトレースログを出力することにしています。(セミナー用に、細部は簡略化しています)
import traceback
try:
#----------------------------------
# データ構造化のメイン処理を記述
#----------------------------------
# この例ではわざとFileNotFoundErrorを発生させる
with open("dummy") as f:
print(type(f))
except:
print(traceback.format_exc())
exit(1)
Pythonでプログラムを作成していて、変数名や関数名をどのようにするか、悩んでしまうことがありませんか?
変数名や関数名の付け方には、いくつかのコツやパターンがあります。
上手に名前を付けることで、プログラムが非常に読みやすいものとなります。ここでは、変数名や関数名の付け方の勘所をご紹介します。
変数名や関数名を付ける際は、できる限り、次のようなことを心がけてください。
serial_number = 10
update_date = "2022-11-25"
xxx = 10 # 意味を推測できない
value_l # 最後は「l(エル)」だが「I(アイ)」や「1(数字)」に見えて紛らわしい
index_from_input_csv_file = 10 # 長すぎる
変数名や関数名は、1~3個程度の単語を組み合わせてつけることが多いです。
2個以上の単語を組み合わせるとき、記述方法には次のようなお決まりのパターンがあります。
名称 | ルール | 例 |
---|---|---|
ローワーキャメルケース | 全ての単語の先頭を大文字とし、区切り文字なしでつなぐ | dataTextFile |
アッパーキャメルケース | 最初の単語以外の先頭を大文字とし、区切り文字なしでつなぐ | DataTextFile |
スネークケース | 単語を_(アンダーバー)でつなぐ | data_text_file |
ケバブケース | 単語を-(ハイフン)でつなぐ Pythonでは使用不可 | data-text-file |
Pythonのプログラムにおいて、クラス名をアッパーキャメルケース、その他の変数名や関数名をスネークケースとすることが多いです。
ARIM事業のコーディング規則でも、そのようにしています。
また、Pythonは変数名に-(ハイフン)を使えませんので、ケバブケースにすることはできません。
Pythonの標準パッケージやモジュールは、PEP8というコーディング規約に基づいて作成されています。
PEP8では、命名規則についても触れられています。
https://pep8-ja.readthedocs.io/ja/latest/
Pythonプログラマも、この規約を参考にすることが推奨されています。
ARIM事業でもコーディング規則を定めており、PEP8をベースにしています。