用扩展名判断文件格式非常简单,但是有可能是错误的。 jpeg文件有固定的文件头,其文件头的格式如下:

Start Marker  | JFIF Marker | Header Length | Identifier

0xff, 0xd8    | 0xff, 0xe0  |    2-bytes    | "JFIF\0"

所以我们可以通过文件头的方式快速判断文件格式:

def is_jpg(filename):
    data = open(filename,'rb').read(11)
    if data[:4] != '\xff\xd8\xff\xe0' and data[:4]!='\xff\xd8\xff\xe1': 
        return False
    if data[6:] != 'JFIF\0' and data[6:] != 'Exif\0': 
        return False
    return True

上面的方式通过文件的前x个字节对文件格式做了判断,如果我们的要求更高,可以通过PIL类库来做判断。

from PIL import Image
def is_jpg(filename):
    try:
        i=Image.open(filename)
        return i.format =='JPEG'
    except IOError:
        return False