统计物理 1.0

Ludwig Boltzmann, who spent much of his life studying Statistical Mechanics, died in 1906, by his own hand. Paul Ehrenfest, carrying on the work, died similarly in 1933. Now it is our turn to study Statistical Mechanics. Perhaps it will be wise to approach the subject cautiously. –in States of Matter, by David. L. Goodstein, 1975, Dover N.Y.

2022.09.10 Ver0.0, 2023.01.18 Ver1.0, 2023.05.19 Ver2.0 **统计物理，还我青春！***！

学习时间	大三下
周课时	4
本人成绩	74 本来是61
课程教材	汪志诚《统计物理学》
个人建议参考教材	Mehran Kardar, Statistical Physics of Particles; R. K. Pathria, Statistical Mechanics 林宗涵《热力学与统计物理》
先修课程	微积分概率论数理统计热学近代物理量子力学

As we shall demonstrate, for discussing equilibrium properties of a macroscopic system, full knowledge of the behavior of its constituent particles is not necessary. All that is required is the likelihood that the particles are in a particular microscopic state.

统计物理学从物体的微观组成和结构出发，把宏观的性质看成微观性质的统计平均，采用统计平均的方法。所以说，这门课的基础是概率论，不幸的是，这门课上得太 crap。

龚昇在《话说微积分》中说“高级的数学未必难，低级的数学未必容易”，统计物理也是同样的道理。这个道理给我的启示是：别看 crappy textbooksss，快去看 Kardar。

Rules for large numbers

Important to check Kardar’s 2.6 Rules for large numbers. （这一段特别精彩lol）

\(N\) dependence encountered in the thermodynamic limit (\(N\rightarrow \infty\) ): Intensive quantities: \(O(N^0)\); Extensive quantities: \(O(N^1)\); Exponential dependence \(O(\exp(N\phi))\).
Simplifications of sums:

Summation of exponential quantities: \(\mathscr{E}=\displaystyle\sum_{i=1}^\mathcal{N}\mathcal{E}_i\), where each term is positive, \(\mathcal{N}\) is some power of \(N\), \(0\leq\mathcal{E}_i\sim O(\exp(N\phi_i))\), then \(\displaystyle\lim_{N\rightarrow\infty}\frac{\ln\mathscr{E}}{N}=\phi_{\max}\).

Saddle point integration: \(\mathcal{J}=\int dx\exp(N\phi(x))\approx\sqrt{\frac{2\pi}{N\vert\phi''(x_{\max})}}e^{N\phi(x_{\max})}\). Stirling’s approximation for \(N!\) comes from this, which is \(\ln N!=N\ln N-N+\frac{1}{2}\ln(2\pi N)+O(\frac{1}{N})\).

为啥统计物理里面我们这么关注指数分布呢？我感觉根源来自于 \(S=k_B\ln\Omega\) 里面的对数关系。

统计物理学的基本概念

这几个概念都是林宗涵老师那本书里的，感觉提一下有利于减少下文字数。

子系：一般把组成宏观物体的基本单元称为子系，可以是气体中的分子，固体中的原子，金属中的传导电子，热辐射场中的光子等；也可以是粒子的某一个自由度，如双原子分子的震动自由度，磁性原子的自旋自由度等等；还可以把系统分成许多宏观大小的部分，把每一个部分看成一个子系。

经典描写：对于 \(r\) 个自由度的子系，微观状态用 \(2r\) 个变量描写，通常用广义坐标 \(q_1,q_2,...,q_r\) 和广义动量 \(p_1,p_2,...,p_r\) （正则形式经典力学，见理论力学）。相空间/相体积 \(d\omega=dq_1...dq_rdp_1...dp_r\)。对于 \(N\) 个子系构成的整个系统，就是把所有子系放一块，用 \(2Nr\) 个变量描写。
量子描写：用量子态/量子数描写。子系量子态与子系相体积的对应关系：子系的一个量子态 \(\leftrightarrow\) 大小为 \(h^r\) 的子相体积。
定域子系：全同多粒子系统在各个粒子的波函数分别局限在空间不同的范围内，彼此没有交叠的情况下，可以从粒子所处的不同位置对它们加以区分，这种子系统称为定域子系。

统计系综理论

德语小知识：配分函数为什么用 \(Z\) 表示？来自于德语 \(\mathfrak{Zustandssumme}\) 的第一个字母 Z，英译为 “the sum over states”，很直观地表明了微观性质的统计平均这个概念。

对于自由度为 \(N\) 的力学系统，其微观状态用 \(N\) 个广义坐标与 \(N\) 个广义动量描写：\(\vec q_i(t);\vec p_i(t)\)。（试想这个系统有 \(N_A\) 个粒子，那么自由度就是 \(6N_A\)，就有 \(6N_A\) 维）。系统微观状态随时间的变化遵从正则运动方程（理论力学）在相空间中形成相轨道：

\[\begin{cases} \frac{d\vec q_i}{dt}=\frac{\partial H}{\partial \vec p_i}\\ \frac{d\vec p_i}{dt}=-\frac{\partial H}{\partial \vec q_i}\quad(i=1,2,...,N) \end{cases}\]

系统微观状态的几率分布函数或几率密度 \(\rho(\boldsymbol p,\boldsymbol q,t)\)，代表 \(t\) 时刻系统的微观状态处于相点\(\rho(\boldsymbol p,\boldsymbol q,t)\)周围小相体积元 \(d\Gamma=\displaystyle\prod_{i=1}^{N}d^3\vec p_id^e\vec q_i\) 内的几率，满足归一化条件 \(\int d\Gamma\rho=1\)。宏观量 \(\langle O\rangle=\int d\Gamma \rho(\boldsymbol p,\boldsymbol q,t)O(\boldsymbol p,\boldsymbol q)\)。

为什么要引入系综？给定一个由大量微观粒子构成的宏观系统，如果我们知道完整的每个粒子的初始条件，带入哈密顿力学，就能算出一切了（确切地知道一个相点，通过哈密顿力学算出从今往后的相轨道）。然而，完整的初始条件，我们不可能知道，也不需要知道，知道了也懒得拿来算。处于同样宏观条件下的平衡态系统（一坨理想气体的 \(p,V,T\)），对应的微观条件的数目是巨大的（每个气体分子的坐标和动量）。其实我们只需要知道代表点在相空间内的概率分布就行了。系综是具有相同宏观条件但是各自处于其微观状量相空间的大量系统的集合。

系统的微观状态随时间不断变化，如何描述系统是否处于平衡态呢？系综随时间如何演化，对应相空间中代表点的概率演化，描述它的定理就是刘维尔定理。

刘维尔定理

保守哈密顿系统。证明过程：连续性方程、带入正则运动方程……
结论：\(\frac{d\rho}{dt}=\frac{\partial\rho}{\partial t}+\{\rho,H\}=0\)。如果把系综在相空间的运动看成代表点组成的“流体”，那么刘维尔定理表示这个“流体”是不可压缩的。系综的几率密度（或代表点密度）在运动中不变。P.S. 其中\(\frac{d}{dt}\) 指跟着代表点一起运动，\(\frac{\partial}{\partial t}\) 指固定地点。上一句话作为 Kardar Eq.(3.11) & Eq.(3.13) 的注释。为啥我们盯着这一群代表点？因为你要套到哈密顿力学里，哈密顿力学描述的是这群粒子广义坐标和广义动量的变化嘛=-=。

微正则系综

如何描述系统达到了平衡态？需要相应的系综满足 \(\frac{\partial\rho_{eq}}{\partial t}=0\) 以及 \(\frac{\partial H}{\partial t}=0\)，代入刘维尔定理也就是 \(\{\rho_{eq},H\}=0\)。如何实现 \(\{\rho_{eq},H\}=0\)？一个实现方式是如果 \(\rho_{eq}\) 是 \(H\) 的函数（泊松括号里整个求导链式法则推出 \(\rho^\prime(H)\{H,H\}=0\)）。于是，对于微正则系综，考虑 mechanically and adiabatically isolated system，也就是 specify 物理量 \(E\)，也就是 \(H=E=const\)，于是 \(ρ_{eq}\) 在相空间两个相邻的能量曲面 \(E\) 和 \(E+ΔE\) (\(\Delta E\rightarrow 0\))之间是一个常数（为啥能整出个 \(\Delta E\)？Justified by thermodynamic limit.）这是统计物理的基本假说，无法证实，但是从这个基础上推导的结果和实验符合得挺好。Refer to Kardar 3.2 Consequences of Liouville’s theorem. The third consequence.
于是，微正则系综为，宏观态 \(M\) 由总能量 \(E\) 和位形坐标 \(\boldsymbol x\) 表示（比如粒子数、体积），\(M\equiv(E,\boldsymbol x)\)。
如何把统计力学角度的熵（\(S=k_Bln\Omega\)）和热力学角度的熵（\(dS=\frac{\bar dQ}{T}\)）联系起来？参见 Pathria 1.3。统计系综理论是不是 self-consistent（从统计物理出发导出的结论是否和热力学经验结论相符）？参见 Kardar 4.2。此处用到了 saddle point approximation。

在林宗涵老师的书中，用理想气体的玻尔兹曼分布导出的熵的微分，和热力学基本微分方程对比，从而将热力学中的熵的微分和统计物理中微观状态数联系起来。其中玻尔兹曼分布的导出使用了斯特林近似，以及概率极大值处代替平均值，本质上就是 saddle point approximation，数学上殊途同归。
微正则系综理论和热力学定律一致。与热力学第零定律：两个系统处于热平衡，则 \(\frac{\partial S_1}{\partial E_1}\vert_{\mathbf{x_1}}=\frac{\partial S_2}{\partial E_2}\vert_{\mathbf{x_2}}\)，对应于 \(\frac{\partial S}{\partial E}\vert_{\mathbf{x}}=\frac{1}{T}\). 与热力学第一定律：若外界对系统做功为 \(\bar dW=\mathbf J·\delta \mathbf x\)，则 \(\frac{\partial S}{\partial x_i}\vert_{E,x_{j\neq i} }=-\frac{J_i}{T}\)，导出热力学基本方程。与热力学第二定律：若系统从非平衡态演化到平衡态，\(\delta S\geq0\).
应用：我感觉接触的其他几本教材里最大的败笔就是完全回避用微正则系综的例子，至少二能级系统和理想气体在数学上毫无难度，而仅仅一句“微正则系综计算过于复杂”让学生错失了很多理解系综理论的机会。

思路：考虑宏观状态对应的所有微观状态（微正则系综复杂性来源），写出熵的表达式，导出热力学量，如平衡态温度 \(\frac{\partial S}{\partial E}\vert_{\boldsymbol x}=\frac{1}{T}\)。The internal energy is specified and the temperature is deduced.
1. 二能级系统（Kardar 4.3）
  
  有 \(N\) 个近独立的定域子系构成的系统，处于平衡态，只有两个能级，每个能级只有一个量子态。例子：非磁性固体中含有密度很低（相互作用可以忽略 -> 近独立子系）的磁性原子，磁性原子的总自旋为 1/2。
  
  特性：热容在高温区以幂次形式趋于零，在某一有限温度达到极大，并在 \(T→0\) 时以指数形式趋于零，是一种肖特基热容行为。只要粒子能级的激发态于其基态（最低能级）之差为有限值时，都会呈现肖特基热容行为，是一种量子效应（热力学第三定律所基于的事实）。在 \(T→\infty\) 时，以幂律形式趋于零，是一种饱和效应，在微观状态数作为能量的函数有最大值的系统中见到。
  
  P.S. 同样的热容行为可以在高等统计物理最后的一维伊辛模型严格解部分找到，虽然自旋之间有了相互作用，但仍然具有量子效应和饱和效应（还没开始写，老鸽王了）。
  
  其实应用微正则系综后就能直接导出二能级系统子系的玻尔兹曼分布┭┮﹏┭┮
2. 理想气体
  
  （Kardar 4.4）用微正则系综处理时数学上比较难的一点就是利用高斯积分的结论（\(S_d=\frac{2\pi^{d/2}}{(d/2-1)!}\)）写出整个相空间的体积。但是这玩意就算你现在不会，到了 (En) Advanced Statistical Mechanics 也得学会，何乐而不学。然后也可以从微正则系综描述的理想气体导出单个分子的玻尔兹曼分布，也就是麦克斯韦速度分布率┭┮﹏┭┮（这些都不需要考虑全同性）
  
  （Kardar 4.5）混合理想气体的熵 -> 吉布斯佯谬 -> 只能通过量子力学粒子全同性解决 -> 经典极限下的连续相空间与量子化相空间 \(d\Gamma_N=\frac{1}{h^{3N}N!}\displaystyle\prod_{i=1}^Nd^3\vec{q_i}d^3\vec{p_i}\)

正则系综

微正则系综里面，我们 specify 了内能，deduce 了温度。其实也可以 specify 温度，deduce 内能。记得从刘维尔尔定理得出结论，平衡态只要 \(\rho_{eq}\) 是哈密顿量 \(H(\vec p,\vec q)\) 的函数即可，如果我们选择 \(\rho_{eq}(\mu)\propto e^{-\beta H}\)，就是正则系综分布函数了。更进一步说，只要概率密度是与哈密顿量对易的力学量（即任意守恒量）的函数即可。

宏观条件：小系统与大热源接触达到平衡（注意这里的“小”和“大”的假设在推导过程中的作用，展开与恒定温度），两者构成的整体是一个大孤立系，相当于小系统的 \((T,\boldsymbol x,N)\) 一定。

笨人当时就很疑惑，如果系统和大热源能交换能量，能量变了，系统的温度为啥是个 specified constant 呢？我现在的理解是这样的。拿出一个大孤立系，比如近独立自旋磁子，考虑其中的一小部分磁子，这一部分磁子的总能量是有涨落的。这里温度 \(T\) 描述的是这个处于平衡态的大孤立系的温度。推导正则系综概率分布的过程中，参见 Kardar Eq.(4.55)，使用的是比起我们观察的小系统大很多的大热源满足的 \(\frac{\partial S_R}{\partial E_R}=\frac{1}{T}\)，整体和大热源的温度都可以用 \(T\) 描述，也没关小系统什么事。

但是，这个大孤立系的温度怎么能代表小系统的温度呢？如果用正则系综导出热力学量，这个小系统比起大热源要足够小，同时也要足够大，大到在数学上可以满足 thermodynamic limit。小系统能量有涨落但是概率分布峰值足够尖锐，平均能量相当于最概然能量，就是小系统的能量。
概率分布 \(\rho_{(T,\boldsymbol{x})}(\mu)=\frac{e^{-\beta H(\mu)}}{Z(T,\boldsymbol{x})}\)，配分函数 \(Z(T,\boldsymbol{x})=\displaystyle\sum _{\mu}e^{-\beta H(\mu)}\)。
用配分函数表示热力学量 \(\bar E=-\frac{\partial}{\partial\beta}lnZ\)，\(\bar Y_\lambda=\frac{1}{\beta}\frac{\partial}{\partial y_\lambda}lnZ\)，\(S=k(lnZ-\beta\frac{\partial}{\partial\beta}lnZ)\)，\(F=-kTlnZ\)。对比热力学基本微分方程得 \(\beta=\frac{1}{kT}\)。

【intuition】用配分函数表示热力学函数，和用 Generator Operator 求统计量的矩，在本质上是一件事情。详见(En) Stochastic Processes。
能量涨落 \(\frac{\sqrt{\overline{(E-\bar E^2)}}}{\bar E}=\frac{\sqrt{kT^2C_V}}{\bar E}\)~\(\frac{1}{\sqrt{N}}\).
应用：为啥说正则系综使用起来更简单呢？比如高等统计物理里面的伊辛模型（无外磁场情况）也用正则系综。大概是因为写出一个宏观态对应的所有微观态相空间比较困难吧（详见微正则系综处理理想气体）。
1. 二能级系统（Kardar 4.7）略
2. 理想气体（Kardar 4.7）略
这两个例子中，构成系统的子系都是近独立子系，系统的概率函数，也就子系的联合概率函数，就是各个子系概率函数的乘积。结论：构成系统的近独立子系满足玻尔兹曼统计。P.S. 二能级系统的子系是定域子系，理想气体的子系是非定域非简并子系，它们都满足玻尔兹曼统计。
如何从微正则系综出发推导出正则系综的配分函数？我们在推导过程中采用了“大热源比起小系统非常大”的假设以及相应的近似。我遇到了两种近似方法：
1. 大热源微观状态数的泰勒展开近似：我所学习的方法，也是林、Kardar、Pathria 等教材使用的方法。
2. \(\Omega_{total}=\Omega_{system}*\Omega_{reservior}\)：参考教材：[Stowe, Keith. An introduction to thermodynamics and statistical mechanics. Cambridge University Press, 2007.]（个人认为这本教材语言严谨性不够）。注意，在没有特定假设的时候我们不能 take this equation for granted——微正则系综总能量不变，若小系统中有能量涨落，大热源能量的涨落是相应的——小系统和大热源是耦合而非独立的。然而，如果大热源足够大，最终数学上可以近似视为两者独立。
3. 这两种形式不同的假设，说的都是”大热源比起小系统非常大“或者”大热源和小系统可以解耦“这句人话。应用在推导中，推导出的结果在数学上也是一致的。注意，见 Kardar Eq.(4.54)，整个系统的微观状态数严谨地写为 \(\Omega_{S\bigoplus R}(E_{Tot})\)，是大热源和小系统微观状态数的直和，而非直接 factorize 相乘，到后面用到大系统很大的近似条件，才把两个部分 decouple。

The Gibbs canonical ensemble

这个 ensemble 我之前学这门课的时候没听说过。见 Kardar 4.8.

The macrostates \(M\equiv(T,\vec J)\) are speified in terms of the external temperature and forces acting on the system; the thermodynamic coordinates \(\boldsymbol x\) appear as addtirional random variables. The system is maintained at constant force through external elements (e.g., pistons or magnets)…The microstates of this combined system occur with the (canonical) probabilities \(p(\mu_s,\boldsymbol x)=\frac{e^{-\beta H(\mu_s)+\beta\boldsymbol J\cdot \boldsymbol x}}{Z(T,N,\boldsymbol J)}\), 配分函数就是 sum over 一下，懒得写了。

注意 \(\boldsymbol J\cdot \boldsymbol x\) 在配分函数里的正负号┭┮﹏┭┮ 配分函数指数的来源：热力学基本微分方程（“能量守恒”）。统计物理中与微观状态数对应时，以熵为中心考虑分别对系统能量和外界功的偏导。推荐参考 Pathria 3.9。

应用
1. 理想气体略
2. 恒定外场中的自旋磁子
  
  这一张讨论的都是近独立子系，如果这些自旋磁子之间有相互作用，也就是高等统计物理里的伊辛模型，哈密顿量就是这么写的。请一定注意正负号！

巨正则系综

宏观条件：小系统与大热源兼大粒子源接触达到平衡。相当于小系统的 \((T,\boldsymbol x,μ)\) 一定。
将系统与大热源绑定为微正则系综推导出巨正则系综配分函数，具体过程详见林书 8.4.1。结论：几率分布 \(\rho_{Ns}=\frac{1}{\Xi}e^{-\alpha N-\beta E_s}\)，归一化条件 \(\Sigma_{N=0}^\infty\Sigma_s\rho_{Ns}=1\)，巨配分函数 \(\Xi=\Sigma_{N=0}^\infty\Sigma_se^{-\alpha N-\beta E_s}=\Sigma_{N=0}^\infty e^{-\alpha N}Z_N(\beta,\{y_\lambda\})\)。启示：为什么这玩意叫巨配分函数？大概是因为里面套着一个配分函数，对很多很多配分函数求和，所以比较“巨”（给巨佬递茶）。记忆配分函数的指数因子每一项的正负号还是回忆来自热力学基本微分方程。
用配分函数表示热力学量懒得写。只写一个巨势 \(\Psi=F-G=-kTln\Xi\)。
能量涨落 \(\frac{\sqrt{\overline{(E-\bar E^2)}}}{\bar E}=\frac{\sqrt{kT^2C_V}}{\bar E}\)~\(\frac{1}{\sqrt{N}}\). 粒子数涨落同理。
经典极限下的形式：i.e. 单原子分子理想气体的热力学函数（跟用正则系综求得的完全一致）。i.e. 固体表面的吸附率（林书8.9）。

用巨正则系综推导费米分布与玻色分布：\(\Xi=\Sigma_{N=0}^\infty\Sigma_se^{-\alpha N-\beta E_s}\) –冗长的数学推导（林书8.10）–> \(\bar\alpha_\lambda=-\frac{g_\lambda}{e^{\alpha+\beta\epsilon_\lambda}±1}\). 还记得“近独立子系”那部分的”ACHTUNG”吗？在这里，我们不需要先求最可几分布，而是直接求出平均分布。不要求 \(\frac{a_\lambda}{g_\lambda}\ll1\)。但是仍然要求“近独立”，因为推导过程中使用了 \(E_N=\Sigma_\lambda a_\lambda\epsilon_\lambda\) 的近独立关系，而 Wikipedia 的词条也说了 Fermi–Dirac statistics, Bose–Einstein statistics 第一句话就有 non-interacting。注意，用巨配分函数推导这俩分布确实要用近独立假设，但是系综理论是可以处理相互作用粒子的（见 (En) Advanced Statistical Mechanics）。

三种系综之间的关系

微正则系综是平衡态统计理论唯一的基本假设。从微正则系综出发，代入热力学基本方程，导出其他系综。
从应用的角度，三种系综是等效的。条件：热力学极限 Thermodynamic limit。
对于满足热力学极限的平衡系综，不必拘泥于宏观条件，哪个方便用哪个。就算粒子数不变，也可以想象粒子数变化，采用巨正则系综，最后用 \(\bar N\) 代表粒子数就可以。如何区分正则分布和巨正则分布？ - andrew shen的回答 - 知乎

后面主要是描述系统中近独立子系的麦克斯韦-玻尔兹曼分布、费米-狄拉克分布和玻色-爱因斯坦分布的。如果组成系统的子系没有相互作用（相互作用很小），则配分函数可以拆成组成系统的相关子系配分函数的乘积。接下来就用林宗涵老师书上的内容了。

近独立子系组成的系统

近独立子系：独立：组成系统的粒子之间相互作用能忽略不计，系统总能量等于各粒子能量之和 \(E=\Sigma_{i=1}^N\epsilon_i\)。近：假如粒子之间完全没有相互作用，粒子之间就不可能交换能量，系统就不可能达到平衡并保持平衡。

前面大数定理部分说了，对于 thermodynamic limit 的系统，可以用最概然分布代替平均分布，也就是 Stirling approximation。

对处于平衡态的孤立系，先求出任意分布 \(\{a_\lambda\}\) 的相对几率 \(W(\{a_\lambda\})\)，再从宏观状态所允许的所有分布中找出使 \(W(\{a_\lambda\})\) 取极大的分布。极大值在这里就是最大值。数学上归结于拉格朗日乘子法（见微积分），求相对几率的极值（为方便一般将 \(W\) 取对数），宏观状态（能量、粒子数…）作为约束条件。

麦克斯韦-玻尔兹曼分布、费米-狄拉克分布和玻色-爱因斯坦分布最可几分布的导出（结果见黄色式子）：

注：引入的拉格朗日乘子 \(α\) 在下一节配分函数表示物理学量时全部用 \(N\) 代换掉，\(α\) 之后可以证明是 \(-μ/(kT)\)，\(β\) 之后可以证明是 \(1/(kT)\)，其中 \(k\) 是玻尔兹曼常数。对不起呀，这个是当时整理的课堂笔记，符号按汪书写的，但是这篇的结构和内容又主要来自于林书。符号不一样，懒得改了！

!ACHTUNG!：方法：证明宏观条件下粒子数极大，最可几分布等于平均分布，计算最可几分布。假设1：近独立假设。假设2：斯特林近似要求 \(\frac{a_\lambda}{g_\lambda}\ll1\)（对任意 \(\lambda\)）。

玻尔兹曼统计

用于可分辨粒子和定域系统（包括可分辨的玻色子和费米子），可以从正则系综里拆出来。

引入子系配分函数 \(Z=\Sigma_\lambda g_\lambda e^{-\beta\epsilon_\lambda}\) 之后可以用于确定定域子系统的一切热力学函数！

用配分函数表示热力学函数

定域子系内能 \(U=-N\frac{\partial}{\partial\beta}lnZ_1\)、外界对系统的作用力 \(Y_\lambda=-\frac{N}{\beta}\frac{\partial}{\partial y_\lambda}lnZ_1\)

-(热力学第一定律)-> 热量的统计表达式 \(\bar dQ=\Sigma_\lambda\epsilon_\lambda d\bar a_\lambda\)

结论：绝热过程中，外参量的变化导致粒子能级的变化，但不改变平均分布。
-(热力学基本微分方程)-> 熵的统计表达式 \(S=Nk(lnZ_1-\beta\frac{\partial}{\partial\beta}lnZ_1)\) -> 参数 \(β\) 是微分式的积分因子，与 \(T\) 成反比，\(k\) 称为玻尔兹曼常数

结论：由熵的统计表达式得出对比微观状态数得 \(S=klnW(\{\bar a_\lambda\})\) 玻尔兹曼墓碑上的公式。由此可见，熵代表系统的混乱度(或无序度)。热力学几率越大，即相应的围观状态数越多，代表系统越混乱。（林书先讲的子系，波尔兹曼公式这里出来了，Kardar 先讲的系综，玻尔兹曼公式从系综那里出来的）

玻尔兹曼统计的应用

二能级系统

略
普朗克的热辐射理论。

研究对象：达到平衡时空窖内的辐射场，称为平衡热辐射或简称热辐射(也叫做黑体辐射)。

瑞利-金斯经典统计理论，由能均分定理得到振子的平均能量为 \(kT\)，公式只在低频区符合。维恩公式只在高频区符合。

普朗克采用唯象拟合的办法得到正确的谱密度公式：放弃能量连续的传统观念，假设振子的能量是间断的。普朗克及瑞利-金斯的理论都是采用波的观点来处理的：空窖中的辐射场相当于无穷多个简谐振子组成的系统，各个振子的频率从0到∞，按频谱 \(g(ν)\) 变化。振子频谱不变，但能量均分定理不适用。假设对于频率为 \(ν\) 的振子，其能量只能取 \(hν\) 的整数倍，然后用麦克斯韦-玻尔兹曼分布求平均。统计物理-平衡热辐射的统计理论
固体热容的统计理论。

见固体物理，还没写捏。

定域子系的经典极限条件

量子性质可以归结为两条，一是能量的取值不连续，二是粒子全同性原理。
定域系统粒子可分辨，无全同性。能量量子化决定了定域系统量子统计与经典统计的区别。能级间隔远小于 \(kT\) 时，则能量量子化效应可以忽略，量子统计的结果还原为经典统计。常把高温称为经典极限。一定温度下，高频区振子不满足经典极限条件，是瑞利-金斯公式只适用于低频区的道理。
在经典极限条件下，\(Z=\Sigma_{n=0}^\infty e^{-\beta\epsilon_n}\)\(\rightarrow\)\(Z=\int...\int\frac{dq_1...dq_rdp_1...dp_r}{h^{r}}e^{-\beta\epsilon}\).

玻色统计和费米统计

非定域子系粒子有全同性，要区分费米子还是玻色子。费米子和玻色子的概念近代物理里面提过了。

用配分函数表示热力学函数

与上面那一节相似，引入巨配分函数\(\Xi_1=\Pi_\lambda(1±e^{-\alpha-\beta\epsilon_\lambda})^{-g_\lambda}=\Xi_1(\alpha,\beta,{y_\lambda})\). （其中 \(\epsilon_\lambda\) 依赖于外参量 \(\{y_\lambda\}\)，并不需要是孤立系）。\(ln\Xi_1=±\Sigma_\lambda g_\lambda ln(1-e^{-\alpha-\beta\epsilon_\lambda})\). （+为费米分布，-为玻色分布）

用巨配分函数表示热力学函数 \(\bar N=-\frac{\partial}{\partial\alpha}ln\Xi_1\), \(\bar E=-\frac{\partial}{\partial\beta}ln\Xi_1\), \(\bar Y_\lambda=-\frac{1}{\beta}\frac{\partial}{\partial y_\lambda}ln\Xi_1\), \(F,G,\Psi\) 懒得写了。

熵 \(S=k(ln\Xi_1-\alpha\frac{\partial}{\partial\alpha}ln\Xi_1-\beta\frac{\partial}{\partial \beta}ln\Xi_1)\) 与最大热力学几率的玻尔兹曼关系仍然成立。

非定域子系的非简并条件

在 \(e^α\) 远大于1的情况下，玻色-爱因斯坦分布与费米-狄拉克分布都还原为麦克斯韦-玻尔兹曼分布。意义：\(e^α\) 远大于1 -> 每一个量子态上平均占据的粒子数远远小于1，泡利不相容原理对费米子的限制可以忽略；费米分布和玻色分布的微观状态数彼此相等，只与麦克斯韦-玻尔兹曼分布差一个 \(1/N!\) 项（\(W_{BE}=W_{FD}=\frac{1}{N!}W_{MB}\)）。
满足非简并条件的非定域系统，把巨配分函数改写为 \(ln\Xi=e^{-α}Z_1\)，其中 \(Z_1\) 是定域系统里配分函数的形式。热力学量 \(\bar N=e^{-\alpha}Z_1\), \(\bar E=-\bar N\frac{\partial}{\partial\beta}lnZ_1\), \(\bar Y_\lambda=-\frac{\bar N}{\beta}\frac{\partial}{\partial y_\lambda}lnZ_1\), \(\mu=-kTln\frac{Z}{\bar N}\) 。然而熵 \(S=\bar Nk(lnZ_1-\beta\frac{\partial}{\partial\beta}lnZ_1)-kln\bar N!\). 最后一项表明全同性原理的影响！不会消失！
粒子质量越大，温度越高，数密度越低，越容易满足非简并条件。亦即粒子平均热波长远远小于粒子之间的平均距离。除了低温下质量很轻的理想气体分子，理想气体分子都满足非简并条件，遵从麦克斯韦-玻尔兹曼分布。低温下的 He 气，4He 是玻色子(偶数个核子)，3He 是费米子(奇数个核子)。金属中迅游电子组成的电子气体是强简并费米气体，热辐射的光子气体是强简并玻色气体。
定域系统经典极限条件只有能量量子化不起作用一条，而非定域系统经典极限条件需要能量量子化和粒子全同性(\(e^α\))都不起作用。

非简并非定域子系

理想气体物态方程

统计物理-理想气体物态方程

麦克斯韦速度分布律

麦克斯韦分布是气体分子质心运动的速度分布，它满足非简并条件（\(e^\alpha\gg1\)）的理想气体所遵从的麦克斯韦-玻尔兹曼分布的一种特殊情形。

能量均分定理

只在满足经典极限的条件下成立，系统微观能量表达式中的每一个正平方项的平均值等于 \((1/2)kT\)。

应用：非简并理想气体分子质心平动动能、分子转动动能。这一部分对比理想气体状态方程定出玻尔兹曼常数k。统计物理-能量均分定理与理想气体内能

小结
- 对非简并理想气体，由于已满足 \(e^\alpha\gg1\)，只需要考察能级间隔与 \(kT\) 之比，就可确定是否满足经典极限条件。由于分子的平动、转动、振动和束缚电子运动的能级间隔不同，需要分别对待。一般而言，对以气态存在的一切温度，平动自由度都满足经典极限条件。对大多数分子，转动自由度也满足经典极限条件。振动由于能级间隔大，必须用量子公式处理，束缚电子运动在绝大多数情况下被冻结。热容是平动、转动和振动各部分贡献之和，只有个别特殊情况下，束缚电子部分才有贡献。
- 一切非简并理想气体的物态方程都满足 \(pV=NkT\) 的经典形式，内部运动对压强无影响。
- 内能只是温度的函数，与体积无关。
- 熵可以分成平动、转动、振动与束缚电子运动四部分贡献之和。
应用：理想固体模型中原子的振动。固体物理

弱简并非定域子系

弱简并：\(e^\alpha>1\)。介绍了弱简并理想费米/玻色气体的热力学函数和热容对于理想气体物态方程的偏离。处理巨配分函数，利用粒子态密度 \(D(\epsilon)d\epsilon=\frac{2\pi V}{h^3}(2m)^{3/2}\epsilon^{1/2}d\epsilon\) 代换。记 \(y=\frac{1}{g_s}n\lambda_T\)，其中 \(\lambda_T=\frac{h}{(2\pi mkT)^{1/2}}\) 是热波长，\(g_s\) 是自旋简并因子。有 \(\frac{pV}{NkT}=1±\frac{1}{2^{5/2}}y+O(y^2)\)，其中 + 为理想费米气体，- 为理想玻色气体。

统计关联

统计关联起源于粒子全同性原理，它是纯粹量子力学性质的。当 \(y→0\)，亦即 \(\lambda_T=\bar{\delta r}\)（\(\bar{\delta r}\)~\(n^{-1/3}\)），统计关联完全可以忽略。根据量子力学，每个粒子相当于一个波包，波包的平均大小为 \(\lambda_T\)，粒子之间的平均距离为\(\bar{\delta r}\)，因此，当\(y→0\) 时，可以完全忽略波包之间的重叠。

但当 \(y\) 的值虽小但已不可忽略时，粒子的波包之间开始重叠，统计关联开始表现出来。尽管理想气体粒子之间的相互作用可以忽略，但对于费米子，由于不能有两个粒子处于同一个粒子量子态，它的波函数必须是反对称的，产生一种有效的排斥作用；而玻色子的波函数是对称的，产生有效的吸引作用。

也可以参见量子力学-全同粒子。数学没具体写，在 Griffiths 5.1.2。

强简并非定域子系

理想玻色气体

玻色-爱因斯坦凝聚(BEC)

理想玻色气体在强简并条件下的一种新相变。

未完待续
光子气体

黑体辐射的粒子观点

未完待续

I also self-learnt a lot of probability theory from Kardar’s book, which makes what we had to memorized for our second year undergrad course under good intuition and now I don’t need to know them by memorizing. Check 随机变量的 fancy 数字特征 - 概率论.

Information and Entropy

The content for this part mainly comes from 2.7 of Kardar (particles) (a lot of direct copy… tell me whether it is appropriate and help me to improve!)

Information

Consider a random variable with a discrete set of outcomes \(\mathbf{x}=\{x_i\}\) (you use a language to write a letter and the language contains 5 letters, “a, b, c, d, e”), occurring with probabilities \(\{p(i)\}\) (in that language, all words start with “a”, making “a” the most frequent letter in texts), for \(i=1,...,M\) (\(M\) is the size of the alphabet, in the “letter” case, \(M=5\)).

Your message contains \(N\) letters. There are \(M^N\) kinds of different letter combinations. Choose the unit as “bits” means \(\ln_2(M^N)\). The number of bits (information) to transmit your text precisely (imaging you are sending via email so the letters are coded in a binary way) is \(N\ln_2M\) (the bits of two texts should add, and the possibilities of the combined text should multiply, which could be reached in this logarithm way).

However, in the limit of large \(N\), we expect the message to contain”roughly” \(\{N_i=Np_i\}\) occurrences for each symbol. The number of typical messages thus corresponds to the number of ways of rearranging the \(\{N_i\}\) occurrences of \(\{x_i\}\), and is given by the multinomial coefficient \(g=\frac{N!}{\prod_{i=1}^M N_i!}\), compared with \(M^N\) before considering the non-uniform distribution. Using Stirling’s approximation, we have \(\ln_2g\approx -N\displaystyle\sum_{i=1}^M p_i\ln_2p_i\).

It is interesting that statistical physicists use \(\ln_2\) to indicate \(\log_2\), while engineers use \(\log x\) to indicate \(\log_2\).
Here, we start from “large \(N\) gives \(\{N_i=Np_i\}\)” (introduced in 概率论)) and then use Stirling’s approximation (introduced in 统计物理). Actually,

\[\text{The bound by the extreme value among distribution -> } \begin{cases} \text{The weak law of large number} \\ \text{Stirling's approximation} \end{cases}\]

The above was written before I took (En) Information Theory, where \(H(X)=-\displaystyle\sum_{x}p(x)\log p(x)\) was derived from three axioms in Shannon’s 1948 paper. In Shannon’s argument, derivation for uniform distribution over \(n\) elements, the entropy \(H_U(n)=H_2(n)\log n\) was determined by a bound, and this sandwich just look like what we did in Stirling’s…

The Entropy of Mixing

Suppose mixing \(M\) distinct components in the context of statistical mechanics. Consider characterizing the distribution, let alone the outcomes from different trials (how many samples taken and the sampling error…).

The entropy for any probability distribution as \(S=-\displaystyle\sum_{i=1}^Mp(i)lnp(i)=-\langle lnp(i)\rangle\).

The above is the entropy for a discrete probability distribution, for that of a continuous distribution, \(S=-\int dxp(x)lnp(x)=-\langle lnp(x)\rangle\). The problem of scaling remains to be discussed.

The BBGKY hierarchy

Scan-reading the irreversibility parts from Kardar’s book (particles)…

To find out how the probability evolves with time…

In the previous posts, we considered \(N\)-particle ideal gas, with no interacting terms in the Hamiltonian. Now we take two-body interactions into account (but not the ignorable higher-body interaction terms), and get the Hamiltonian of the weakly interacting gas

\(\mathcal{H}(\mathbf{p},\mathbf{q})=\displaystyle\sum_{i=1}^N[\frac{\vec{p_i}^2}{2m}+U(\vec{q_i})]+\frac{1}{2}\displaystyle\sum_{(i,j)=1}^N\mathcal{V}(\vec{q_i}-\vec{q_j})\).

Consider \(f_s(\vec p_1,...,\vec q_s,t)\) as the expectation value of finding \(S\) of the \(N\) particles at point \((\vec p_1,...,\vec q_s)\) in the phase space at time \(t\).

With the help of dividing the Hamiltonian…, after tedious mathematical derivations… (and some more elaborate math can be find here PHY526_Sussman), we have the time evolution of \(f_s\) as

\(\frac{\partial f_s}{\partial t}-\{\mathcal{H_s,f_s}\}=\displaystyle\sum_{n=1}^N\int dV_{s+1}\frac{\partial \mathcal{V(\vec{q_n}-\vec{q}_{s+1})}}{\partial \vec{q}_n}·\frac{\partial f_{s+1}}{\partial\vec{p}_n}\).

This is the BBGKY hierarchy.

The Boltzmann Equation

The above BBGKY hierarchy is too complicated to tell us anything. Consider the time scales of different terms under short-range interactions, cancel something,

and the final result is a closed form equation for \(f_1\), as equation (3.41) in Kardar’s book. I don’t bother to write down.

The H-theorem and irreversibility

If \(f_1(\vec p,\vec q,t)\) satisfies the Boltzmann equation, then \(d\Eta/dt\leq 0\), where

\(\Eta(t)=\int d^3\vec pd^3\vec qf_1(\vec p,\vec q,t)lnf_1(\vec p,\vec q,t)\),

which is related to the information content of the one-particle PDF (for information of a distribution, see Biophysics). Proved by plugging in the Boltzmann equation.

Key mathematical step for introducing time irreversibility: check Kardar Eq.(3.40). The assumption of molecular chaos (factorizing \(f_2\) as the product of two \(f_1\)) is applied to the “before collision term”, but not the “after collision term”, since when out of equilibrium, after collision, the coordinates are likely to be more correlated!

References

Kardar, Mehran. Statistical physics of particles. Cambridge University Press, 2007.

致谢

感谢多伦多大学物理学院 Yuzheng Xie, Yuchong Li。

文档信息

本文作者：L Shi
本文链接：https://SHI200005.github.io/2022/09/10/Statistical-Mechanics/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

SHI

统计物理 1.0

Rules for large numbers

统计物理学的基本概念

统计系综理论

刘维尔定理

微正则系综

正则系综

The Gibbs canonical ensemble

巨正则系综

三种系综之间的关系

近独立子系组成的系统

玻尔兹曼统计

用配分函数表示热力学函数

玻尔兹曼统计的应用

定域子系的经典极限条件

玻色统计和费米统计

用配分函数表示热力学函数

非定域子系的非简并条件

非简并非定域子系

理想气体物态方程

麦克斯韦速度分布律

能量均分定理

弱简并非定域子系

统计关联

强简并非定域子系

理想玻色气体

Information and Entropy

Information

The Entropy of Mixing

The BBGKY hierarchy

The Boltzmann Equation

The H-theorem and irreversibility

References

致谢

文档信息

Search

Table of Contents