#!/usr/bin/env python
# coding: utf-8

# # 索引和分片

# ## 索引

# 对于一个有序序列，可以通过索引的方法来访问对应位置的值。字符串便是一个有序序列的例子，**Python**使用 `[]` 来对有序序列进行索引。

# In[1]:


s = "hello world"
s[0]


# **Python**中索引是从 `0` 开始的，所以索引 `0` 对应与序列的第 `1` 个元素。为了得到第 `5` 个元素，需要使用索引值 `4` 。

# In[2]:


s[4]


# 除了正向索引，**Python**还引入了负索引值的用法，即从后向前开始计数，例如，索引 `-2` 表示倒数第 `2` 个元素：

# In[3]:


s[-2]


# 单个索引大于等于字符串的长度时，会报错：

# In[4]:


s[11]


# ## 分片

# 分片用来从序列中提取出想要的子序列，其用法为：
# 
#     var[lower:upper:step]
# 
# 其范围包括 `lower` ，但不包括 `upper` ，即 `[lower, upper)`， `step` 表示取值间隔大小，如果没有默认为`1`。

# In[5]:


s


# In[6]:


s[1:3]


# 分片中包含的元素的个数为 `3-1=2` 。

# 也可以使用负索引来指定分片的范围：

# In[7]:


s[1:-2]


# 包括索引 `1` 但是不包括索引 `-2` 。
# 
# lower和upper可以省略，省略lower意味着从开头开始分片，省略upper意味着一直分片到结尾。

# In[8]:


s[:3]


# In[9]:


s[-3:]


# In[10]:


s[:]


# 每隔两个取一个值：

# In[11]:


s[::2]


# 当step的值为负时，省略lower意味着从结尾开始分片，省略upper意味着一直分片到开头。

# In[12]:


s[::-1]


# 当给定的upper超出字符串的长度（注意：因为不包含upper，所以可以等于）时，Python并不会报错，不过只会计算到结尾。

# In[13]:


s[:100]


# ## 使用“0”作为索引开头的原因

# ### 使用`[low, up)`形式的原因

# 假设需要表示字符串 `hello` 中的内部子串 `el` ：
# 
# |方式|`[low, up)`|`(low, up]`|`(lower, upper)`|`[lower, upper]`
# |--|--|--|--|--|
# |表示|`[1,3)`|`(0,2]`|`(0,3)`|`[1,2]`
# |序列长度|`up - low`|`up - low`|`up - low - 1`|`up - low + 1`
# 
# 对长度来说，前两种方式比较好，因为不需要烦人的加一减一。
# 
# 现在只考虑前两种方法，假设要表示字符串`hello`中的从头开始的子串`hel`：
# 
# |方式|`[low, up)`|`(low, up]`
# |--|--|
# |表示|`[0,3)`|`(-1,2]`|
# |序列长度|`up - low`|`up - low`|
# 
# 第二种表示方法从`-1`开始，不是很好，所以选择使用第一种`[low, up)`的形式。

# ### 使用0-base的形式

# > Just too beautiful to ignore.  
# ----Guido van Rossum

# 两种简单的情况：
# 
# - 从头开始的n个元素；
#     - 使用0-base：`[0, n)`
#     - 使用1-base：`[1, n+1)`
# 
# - 第`i+1`个元素到第`i+n`个元素。
#     - 使用0-base：`[i, n+i)`
#     - 使用1-base：`[i+1, n+i+1)`
# 
# 1-base有个`+1`部分，所以不推荐。
# 
# 综合这两种原因，**Python**使用0-base的方法来进行索引。