形式言語理論における空文字列(くうもじれつ・からもじれつ、英: empty string)とは、長さが0の一意な文字列であり、文字列における空集合である。主にコンピュータ、特にプログラミング言語において用いられる用語である。ヌル文字列(英: null string)とも呼ばれ、空文字列と同一視されることもあるが、ヌルポインタやヌル参照と紛らわしい。Javaではnull stringと言えば無効な参照値であるnullを指し、String型の有効な参照値である空文字列""とは明確に区別する。

形式言語における空文字列

形式的には、文字列は文字や数字といったシンボルの有限列として表現されるが、空文字列はこの有限列の特殊なケースである。空文字列は長さがゼロであり、何のシンボルも含まない。また、空文字列は必ず一つしか存在しない。これは、2つの異なる文字列が存在する場合、文字列の長さか、文字列に含まれるシンボルのいずれかが必ず異なっているためである。形式言語では、空文字列はλで表される(λの大文字であるΛや、εを使う場合もある)。

空文字列を空言語∅と混同しないこと。空言語は、形式言語(文字列の集合)において、空文字列すらも含まない空集合のことを意味する。

空文字列の持つ性質を以下に挙げる。

  • | λ | = 0 {\displaystyle |\lambda \,|=0} : 空文字列の長さは0となる。
  • λ s = s λ = s {\displaystyle \lambda \, s=s \lambda \,=s} : ある文字列に空文字列を連結しても、元の文字列と同じものになる。空文字列は、文字列連結における単位元である(ある文字集合Σにおいて自由モノイドを構成する)。
  • λ R = λ {\displaystyle {\lambda \,}^{R}=\lambda \,} : 空文字列は反転しても空文字列のままとなる。
  • 辞書式順序では、空文字列はいかなる文字列よりも前に配置される。これは空文字列が最も短い文字列であるためである。

プログラミング言語における利用

多くのプログラミング言語において、各文字列はそれぞれ個別のメモリ領域に格納される。そのため、同じ内容の文字列(例えば空文字列)がメモリ上の複数箇所に格納されることがある(長さ0の文字列でも格納にはメモリが必要なことに注意。使用するメモリの量は文字列の格納形式により異なる)。この場合、形式言語の定義と異なり、複数の空文字列がメモリ上に同時に存在することになる。しかし、文字列比較ルーチン(関数やメソッド)を使えば、これらの空文字列は全て同じであることを示すことができる。

空文字列はヌルポインタやヌル参照とは別物である。ヌルポインタやヌル参照の指す先には何も存在しない(空文字列すら存在しない)。たいていの言語で、ヌルポインタやヌル参照に対して何らかの処理を実行しようとした場合は通例不正な操作であるとみなされてエラーが発生するが、空文字列は正当な文字列のひとつとして扱われる。たとえばJavaにおいてnullを参照する文字列クラス変数の長さを求めようとするとNullPointerException例外が発生するが、空文字列の長さを求めれば0が返される。また、空文字列とnullを比較すると偽が返される。

C言語およびC の標準ライブラリにおける文字列操作関数および文字列クラスでは、引数にヌルポインタ (NULLあるいはnullptr) が渡された場合の動作は未定義となっており、通例不正な操作とみなされてプログラムが異常終了する原因となる。

一方、Objective-Cではnilを参照する文字列オブジェクトに対する操作(メッセージ送信)は正当なものとして扱われるが、空文字列と等価ではない。

プログラミング言語によっては、エラーの発生を低減するため以下の値を同じものとして扱うことがある。

  • 空文字列
  • ヌル参照
  • 整数の0
  • 浮動小数点数の0
  • ブーリアン型のfalse
  • ASCIIのヌル文字

また、プログラミング言語によっては、変数が最初に使われるとき、あらかじめ空文字列が入っているものとするものもある。

通常、空文字列は他の文字列と同じように表現される。文字列を、文字列終端文字を使用して(ヌル終端文字列または改行区切りのプレインテキストとして)実装している場合、空文字列は単一の文字列終端文字で表現される。

  • プログラミング言語によっては、数値など文字列でないものと空文字列を連結すると、変数の型を文字列に型変換する。
  • Oracle Databaseでは空文字列とヌル (SQL)が区別されない。
  • 多くのプログラミング言語において、空文字列は最小のクワインである。

空文字列の例

  • 位取り記数法では、空文字列はいかなる基数においても0を表す(先行ゼロがない場合においても)。ただし形式言語理論以外の領域では、空文字列は視覚的に表現ができないため、ゼロという数は伝統的に数字0の形で表現される。
  • 文字列が文字へのポインタで表されるC言語などでは、ヌル文字へのポインタで表される文字列となる。ゼロで埋められたメモリ領域をヌル終端文字列として解釈すると空文字列となる。
  • 空文字列はテキスト中の空行という形でも現れる。テキストファイルでよく見られるように、改行コードを2つ連続させることで空行が発生する。空行の用途として、テキスト処理で段落の区切りを表現するのに使われる場合がある(例:Markdown)。

関連項目

  • 空集合
  • ヌル終端文字列

参考文献


空白文字のコピペ【インスタ・ツイッター可】半角・全角・長い空白も hanatag

空文字列(長さ0の文字列)を入力する もう一度学ぶMSAccess

空 筆文字のイラスト素材 [14396561] PIXTA

js去除字符串空格(空白符) 一只看夕阳的猫 博客园

【Python入門】空の文字列を生成する方法とは?空の文字列の生成方法を徹底解説 YuNiWiki