mv data/types image

This change also merges formats into the new image module.
2016-08-02 18:45:30 -04:00 · 2016-08-02 18:45:30 -04:00 · 32a6c22b43
commit 32a6c22b43
parent a516c08deb
14 changed files with 342 additions and 258 deletions
--- a/data/model/v2.py
+++ b/data/model/v2.py
@ -1,11 +1,5 @@
-from data.types import (
+from image import Blob, BlobUpload, ManifestJSON, Repository, Tag
-  Blob,
+from image.docker.v1 import DockerV1Metadata
  BlobUpload,
  DockerV1Metadata,
  ManifestJSON,
  Repository,
  Tag,
 )
 def create_repository(namespace_name, repo_name, user):
  model.repository.create_repository(namespace, reponame, user)
@ -75,14 +69,13 @@ def docker_v1_metadata_by_tag(namespace_name, repo_name, tag_name):
 def docker_v1_metadata_by_image_id(namespace_name, repo_name, image_ids):
  images_query = model.image.lookup_repository_images(repo, all_image_ids)
-  return [DockerV1Metadata(
+  return {image.docker_image_id: DockerV1Metadata(namespace_name=namespace_name,
-    namespace_name=namespace_name,
+                                                  repo_name=repo_name,
-    repo_name=repo_name,
+                                                  image_id=image.docker_image_id,
-    image_id=image.docker_image_id,
+                                                  checksum=image.v1_checksum,
-    checksum=image.v1_checksum,
+                                                  content_checksum=image.content_checksum,
-    content_checksum=image.content_checksum,
+                                                  compat_json=image.v1_json_metadata)
-    compat_json=image.v1_json_metadata,
+          for image in images_query}
  ) for image in images_query]
 def get_parents_docker_v1_metadata(namespace_name, repo_name, image_id):
--- a/endpoints/v2/init.py
+++ b/endpoints/v2/init.py
@ -54,7 +54,7 @@ def paginate(limit_kwarg_name='limit', offset_kwarg_name='offset',
      def callback(num_results, response):
        if num_results <= limit:
          return
-        next_page_token = encrypt_page_token({'offset': limit+offset})
+        next_page_token = encrypt_page_token({'offset': limit + offset})
        link = get_app_url() + url_for(request.endpoint, **request.view_args)
        link += '?%s; rel="next"' % urlencode({'n': limit, 'next_page': next_page_token})
        response.headers['Link'] = link
--- a/endpoints/v2/blob.py
+++ b/endpoints/v2/blob.py
@ -216,7 +216,7 @@ def monolithic_upload_or_last_chunk(namespace_name, repo_name, upload_uuid):
  # Ensure the digest is present before proceeding.
  digest = request.args.get('digest', None)
  if digest is None:
-    raise BlobUploadInvalid()
+    raise BlobUploadInvalid(detail={'reason': 'Missing digest arg on monolithic upload'})
  # Find the upload.
  blob_upload = v2.blob_upload_by_uuid(namespace_name, repo_name, upload_uuid)
@ -271,6 +271,9 @@ def delete_digest(namespace_name, repo_name, upload_uuid):
 def _render_range(num_uploaded_bytes, with_bytes_prefix=True):
  """
  Returns a string formatted to be used in the Range header.
  """
  return '{0}0-{1}'.format('bytes=' if with_bytes_prefix else '', num_uploaded_bytes - 1)
@ -327,6 +330,7 @@ def _start_offset_and_length(headers):
      start_offset, length = _parse_range_header(range_header)
    except _InvalidRangeHeader:
      return None, None
  return start_offset, length
@ -339,6 +343,7 @@ def _upload_chunk(blob_upload, start_offset, length):
  # Check for invalidate arguments.
  if None in {blob_upload, start_offset, length}:
    return None
  if start_offset > 0 and start_offset > blob_upload.byte_count:
    return None
@ -425,7 +430,7 @@ def _validate_digest(blob_upload, expected_digest):
  computed_digest = digest_tools.sha256_digest_from_hashlib(blob_upload.sha_state)
  if not digest_tools.digests_equal(computed_digest, expected_digest):
    logger.error('Digest mismatch for upload %s: Expected digest %s, found digest %s',
-                 upload_obj.uuid, expected_digest, computed_digest)
+                 blob_upload.uuid, expected_digest, computed_digest)
    raise BlobUploadInvalid(detail={'reason': 'Digest mismatch on uploaded blob'})
--- a/endpoints/v2/manifest.py
+++ b/endpoints/v2/manifest.py
@ -9,13 +9,6 @@ import features
 from app import docker_v2_signing_key, app, metric_queue
 from auth.registry_jwt_auth import process_registry_jwt_auth
 from data import model
 from data.types import (
  DockerSchema1Manifest,
  DockerSchema1ManifestBuilder,
  ManifestException,
  DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE,
  DOCKER_SCHEMA2_CONTENT_TYPES,
 )
 from digest import digest_tools
 from endpoints.common import parse_repository_name
 from endpoints.decorators import anon_protect
@ -24,6 +17,9 @@ from endpoints.v2.errors import (BlobUnknown, ManifestInvalid, ManifestUnknown,
                                 NameInvalid)
 from endpoints.trackhelper import track_and_log
 from endpoints.notificationhelper import spawn_notification
 from image.docker import ManifestException
 from image.docker.schema1 import DockerSchema1Manifest, DockerSchema1ManifestBuilder
 from image.docker.schema2 import DOCKER_SCHEMA2_CONTENT_TYPES
 from util.registry.replication import queue_storage_replication
 from util.names import VALID_TAG_PATTERN
@ -56,7 +52,7 @@ def fetch_manifest_by_tagname(namespace_name, repo_name, tag_name):
    metric_queue.repository_pull.Inc(labelvalues=[namespace_name, repo_name, 'v2'])
  response = make_response(manifest.bytes, 200)
-  response.headers['Content-Type'] = DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE
+  response.headers['Content-Type'] = manifest.content_type
  response.headers['Docker-Content-Digest'] = manifest.digest
  return response
@ -78,7 +74,7 @@ def fetch_manifest_by_digest(namespace_name, repo_name, manifest_ref):
    metric_queue.repository_pull.Inc(labelvalues=[namespace_name, repo_name, 'v2'])
  response = make_response(manifest.json, 200)
-  response.headers['Content-Type'] = DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE
+  response.headers['Content-Type'] = manifest.content_type
  response.headers['Docker-Content-Digest'] = manifest.digest
  return response
@ -151,16 +147,15 @@ def _write_manifest(namespace_name, repo_name, manifest):
  # Ensure all the blobs in the manifest exist.
  storage_query = model.storage.lookup_repo_storages_by_content_checksum(repo, manifest.checksums)
  storage_map = {storage.content_checksum: storage for storage in storage_query}
-  for extracted_layer_metadata in manifest.layers:
+  for layer in manifest.layers:
-    digest_str = str(extracted_layer_metadata.digest)
+    digest_str = str(layer.digest)
    if digest_str not in storage_map:
      raise BlobUnknown(detail={'digest': digest_str})
  # Lookup all the images and their parent images (if any) inside the manifest.
  # This will let us know which v1 images we need to synthesize and which ones are invalid.
  all_image_ids = list(manifest.docker_image_ids | manifest.parent_image_ids)
-  images = v2.docker_v1_metadata_by_image_id(namespace_name, repo_name, all_image_ids)
+  images_map = v2.docker_v1_metadata_by_image_id(namespace_name, repo_name, all_image_ids)
  images_map = {image.image_id: image for image in images}
  # Rewrite any v1 image IDs that do not match the checksum in the database.
  try:
@ -181,14 +176,14 @@ def _write_manifest(namespace_name, repo_name, manifest):
    raise ManifestInvalid(detail={'message': me.message})
  # Store the manifest pointing to the tag.
-  leaf_layer_id = images_map[manifest.layers[-1].v1_metadata.image_id].image_id
+  leaf_layer_id = images_map[manifest.leaf_layer.v1_metadata.image_id].image_id
  v2.save_manifest(namespace_name, repo_name, tag_name, leaf_layer_id, manifest.digest, manifest.bytes)
  # Queue all blob manifests for replication.
  # TODO(jschorr): Find a way to optimize this insertion.
  if features.STORAGE_REPLICATION:
-    for extracted_v1_metadata in manifest.layers:
+    for layer in manifest.layers:
-      digest_str = str(extracted_v1_metadata.digest)
+      digest_str = str(layer.digest)
      queue_storage_replication(namespace_name, storage_map[digest_str])
  track_and_log('push_repo', repo, tag=manifest.tag)
--- a/endpoints/verbs.py
+++ b/endpoints/verbs.py
@ -11,18 +11,18 @@ from auth.auth import process_auth
 from auth.auth_context import get_authenticated_user
 from auth.permissions import ReadRepositoryPermission
 from data import model, database
-from endpoints.trackhelper import track_and_log
+from endpoints.common import route_show_if, parse_repository_name
 from endpoints.decorators import anon_protect
 from endpoints.trackhelper import track_and_log
 from endpoints.v2.blob import BLOB_DIGEST_ROUTE
 from image.appc import AppCImageFormatter
 from image.docker.squashed import SquashedDockerImageFormatter
 from storage import Storage
 from util.registry.filelike import wrap_with_handler
 from util.registry.queuefile import QueueFile
 from util.registry.queueprocess import QueueProcess
 from util.registry.torrent import (make_torrent, per_user_torrent_filename, public_torrent_filename,
                                   PieceHasher)
 from util.registry.filelike import wrap_with_handler
 from formats.squashed import SquashedDockerImage
 from formats.aci import ACIImage
 from storage import Storage
 from endpoints.v2.blob import BLOB_DIGEST_ROUTE
 from endpoints.common import route_show_if, parse_repository_name
 verbs = Blueprint('verbs', __name__)
@ -372,7 +372,7 @@ def get_aci_signature(server, namespace, repository, tag, os, arch):
@verbs.route('/aci/<server>/<namespace>/<repository>/<tag>/aci/<os>/<arch>/', methods=['GET', 'HEAD'])
@process_auth
 def get_aci_image(server, namespace, repository, tag, os, arch):
-  return _repo_verb(namespace, repository, tag, 'aci', ACIImage(),
+  return _repo_verb(namespace, repository, tag, 'aci', AppCImageFormatter(),
                    sign=True, checker=os_arch_checker(os, arch), os=os, arch=arch)
@ -380,7 +380,7 @@ def get_aci_image(server, namespace, repository, tag, os, arch):
@verbs.route('/squash/<namespace>/<repository>/<tag>', methods=['GET'])
@process_auth
 def get_squashed_tag(namespace, repository, tag):
-  return _repo_verb(namespace, repository, tag, 'squash', SquashedDockerImage())
+  return _repo_verb(namespace, repository, tag, 'squash', SquashedDockerImageFormatter())
@route_show_if(features.BITTORRENT)
--- a/formats/init.py
+++ b/formats/init.py
--- a/formats/tarimageformatter.py
+++ b/formats/tarimageformatter.py
@ -1,56 +0,0 @@
 import tarfile
 from util.registry.gzipwrap import GzipWrap
 class TarImageFormatter(object):
  """ Base class for classes which produce a TAR containing image and layer data. """
  def build_stream(self, namespace, repository, tag, synthetic_image_id, layer_json,
                   get_image_iterator, get_layer_iterator, get_image_json):
    """ Builds and streams a synthetic .tar.gz that represents the formatted TAR created by this
        class's implementation.
    """
    return GzipWrap(self.stream_generator(namespace, repository, tag,
                                             synthetic_image_id, layer_json,
                                             get_image_iterator, get_layer_iterator,
                                             get_image_json))
  def stream_generator(self, namespace, repository, tag, synthetic_image_id,
                       layer_json, get_image_iterator, get_layer_iterator, get_image_json):
    raise NotImplementedError
  def tar_file(self, name, contents, mtime=None):
    """ Returns the TAR binary representation for a file with the given name and file contents. """
    length = len(contents)
    tar_data = self.tar_file_header(name, length, mtime=mtime)
    tar_data += contents
    tar_data += self.tar_file_padding(length)
    return tar_data
  def tar_file_padding(self, length):
    """ Returns TAR file padding for file data of the given length. """
    if length % 512 != 0:
      return '\0' * (512 - (length % 512))
    return ''
  def tar_file_header(self, name, file_size, mtime=None):
    """ Returns TAR file header data for a file with the given name and size. """
    info = tarfile.TarInfo(name=name)
    info.type = tarfile.REGTYPE
    info.size = file_size
    if mtime is not None:
      info.mtime = mtime
    return info.tobuf()
  def tar_folder(self, name, mtime=None):
    """ Returns TAR file header data for a folder with the given name. """
    info = tarfile.TarInfo(name=name)
    info.type = tarfile.DIRTYPE
    if mtime is not None:
      info.mtime = mtime
    # allow the directory to be readable by non-root users
    info.mode = 0755
    return info.tobuf()
--- a/image/init.py
+++ b/image/init.py
@ -0,0 +1,103 @@
 import tarfile
 from collections import namedtuple
 from util.registry.gzipwrap import GzipWrap
 class ManifestJSON(namedtuple('ManifestJSON', ['digest', 'json', 'media_type'])):
  """
  ManifestJSON represents a Manifest of any format.
  """
 class Repository(namedtuple('Repository', ['id', 'name', 'namespace_name'])):
  """
  Repository represents a collection of tags.
  """
 class Tag(namedtuple('Tag', ['name', 'repository'])):
  """
  Tag represents a user-facing alias for referencing a set of Manifests.
  """
 class BlobUpload(namedtuple('BlobUpload', ['uuid', 'byte_count', 'uncompressed_byte_count',
                                           'chunk_count', 'sha_state', 'location_name',
                                           'storage_metadata', 'piece_sha_state', 'piece_hashes'])):
  """
  BlobUpload represents the current state of an Blob being uploaded.
  """
 class Blob(namedtuple('Blob', ['digest', 'size', 'locations'])):
  """
  Blob represents an opaque binary blob saved to the storage system.
  """
 class TarImageFormatter(object):
  """
  Base class for classes which produce a tar containing image and layer data.
  """
  def build_stream(self, namespace, repository, tag, synthetic_image_id, layer_json,
                   get_image_iterator, get_layer_iterator, get_image_json):
    """
    Builds and streams a synthetic .tar.gz that represents the formatted tar created by this class's
    implementation.
    """
    return GzipWrap(self.stream_generator(namespace, repository, tag,
                                          synthetic_image_id, layer_json,
                                          get_image_iterator, get_layer_iterator,
                                          get_image_json))
  def stream_generator(self, namespace, repository, tag, synthetic_image_id,
                       layer_json, get_image_iterator, get_layer_iterator, get_image_json):
    raise NotImplementedError
  def tar_file(self, name, contents, mtime=None):
    """
    Returns the tar binary representation for a file with the given name and file contents.
    """
    length = len(contents)
    tar_data = self.tar_file_header(name, length, mtime=mtime)
    tar_data += contents
    tar_data += self.tar_file_padding(length)
    return tar_data
  def tar_file_padding(self, length):
    """
    Returns tar file padding for file data of the given length.
    """
    if length % 512 != 0:
      return '\0' * (512 - (length % 512))
    return ''
  def tar_file_header(self, name, file_size, mtime=None):
    """
    Returns tar file header data for a file with the given name and size.
    """
    info = tarfile.TarInfo(name=name)
    info.type = tarfile.REGTYPE
    info.size = file_size
    if mtime is not None:
      info.mtime = mtime
    return info.tobuf()
  def tar_folder(self, name, mtime=None):
    """
    Returns tar file header data for a folder with the given name.
    """
    info = tarfile.TarInfo(name=name)
    info.type = tarfile.DIRTYPE
    if mtime is not None:
      info.mtime = mtime
    # allow the directory to be readable by non-root users
    info.mode = 0755
    return info.tobuf()
--- a/image/appc/init.py
+++ b/image/appc/init.py
@ -6,14 +6,15 @@ from uuid import uuid4
 from app import app
 from util.registry.streamlayerformat import StreamLayerMerger
-from formats.tarimageformatter import TarImageFormatter
+from image import TarImageFormatter
 ACNAME_REGEX = re.compile(r'[^a-z-]+')
-class ACIImage(TarImageFormatter):
+class AppCImageFormatter(TarImageFormatter):
-  """ Image formatter which produces an ACI-compatible TAR.
+  """
  Image formatter which produces an tarball according to the AppC specification.
  """
  def stream_generator(self, namespace, repository, tag, synthetic_image_id,
@ -40,7 +41,9 @@ class ACIImage(TarImageFormatter):
  @staticmethod
  def _build_isolators(docker_config):
-    """ Builds ACI isolator config from the docker config. """
+    """
    Builds ACI isolator config from the docker config.
    """
    def _isolate_memory(memory):
      return {
@ -107,22 +110,24 @@ class ACIImage(TarImageFormatter):
  @staticmethod
  def _build_ports(docker_config):
-    """ Builds the ports definitions for the ACI. """
+    """
    Builds the ports definitions for the ACI.
    Formats:
      port/tcp
      port/udp
      port
    """
    ports = []
-    for docker_port_definition in ACIImage._get_docker_config_value(docker_config, 'Ports', []):
+    for docker_port in AppCImageFormatter._get_docker_config_value(docker_config, 'Ports', []):
      # Formats:
      # port/tcp
      # port/udp
      # port
      protocol = 'tcp'
      port_number = -1
-      if '/' in docker_port_definition:
+      if '/' in docker_port:
-        (port_number, protocol) = docker_port_definition.split('/')
+        (port_number, protocol) = docker_port.split('/')
      else:
-        port_number = docker_port_definition
+        port_number = docker_port
      try:
        port_number = int(port_number)
@ -149,9 +154,9 @@ class ACIImage(TarImageFormatter):
    volumes = []
    def get_name(docker_volume_path):
-      return "volume-%s" % ACIImage._ac_name(docker_volume_path)
+      return "volume-%s" % AppCImageFormatter._ac_name(docker_volume_path)
-    for docker_volume_path in ACIImage._get_docker_config_value(docker_config, 'Volumes', []):
+    for docker_volume_path in AppCImageFormatter._get_docker_config_value(docker_config, 'Volumes', []):
      if not docker_volume_path:
        continue
@ -219,9 +224,9 @@ class ACIImage(TarImageFormatter):
        "eventHandlers": [],
        "workingDirectory": config.get('WorkingDir', '') or '/',
        "environment": [{"name": key, "value": value} for (key, value) in env_vars],
-        "isolators": ACIImage._build_isolators(config),
+        "isolators": AppCImageFormatter._build_isolators(config),
-        "mountPoints": ACIImage._build_volumes(config),
+        "mountPoints": AppCImageFormatter._build_volumes(config),
-        "ports": ACIImage._build_ports(config),
+        "ports": AppCImageFormatter._build_ports(config),
        "annotations": [
          {"name": "created", "value": docker_layer_data.get('created', '')},
          {"name": "homepage", "value": source_url},
--- a/image/docker/init.py
+++ b/image/docker/init.py
@ -0,0 +1,10 @@
 """
 docker implements pure data transformations according to the many Docker specifications.
 """
 class DockerException(Exception):
  pass
 class ManifestException(DockerException):
  pass
--- a/image/docker/schema1.py
+++ b/image/docker/schema1.py
@ -1,5 +1,11 @@
-import json
+"""
 schema1 implements pure data transformations according to the Docker Manifest v2.1 Specification.
 https://github.com/docker/distribution/blob/master/docs/spec/manifest-v2-1.md
 """
 import hashlib
 import json
 import logging
 from collections import namedtuple, OrderedDict
@ -9,72 +15,72 @@ from jwkest.jws import SIGNER_ALGS, keyrep
 from jwt.utils import base64url_encode, base64url_decode
 from digest import digest_tools
 from image.docker import ManifestException
 from image.docker.v1 import DockerV1Metadata
 logger = logging.getLogger(__name__)
-DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.v1+prettyjws'
+# Content Types
-DOCKER_SCHEMA2_MANIFEST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.v2+json'
+DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.v1+json'
-DOCKER_SCHEMA2_MANIFESTLIST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.list.v2+json'
+DOCKER_SCHEMA1_SIGNED_MANIFEST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.v1+prettyjws'
 DOCKER_SCHEMA1_CONTENT_TYPES = [DOCKER_SCHEMA1_MANIFEST_CONTENT_TYPE,
                                DOCKER_SCHEMA1_SIGNED_MANIFEST_CONTENT_TYPE]
-DOCKER_SCHEMA2_CONTENT_TYPES = [DOCKER_SCHEMA2_MANIFEST_CONTENT_TYPE,
+# Keys for signature-related data
-                                DOCKER_SCHEMA2_MANIFESTLIST_CONTENT_TYPE]
+DOCKER_SCHEMA1_SIGNATURES_KEY = 'signatures'
 DOCKER_SCHEMA1_HEADER_KEY = 'header'
 DOCKER_SCHEMA1_SIGNATURE_KEY = 'signature'
 DOCKER_SCHEMA1_PROTECTED_KEY = 'protected'
 DOCKER_SCHEMA1_FORMAT_LENGTH_KEY = 'formatLength'
 DOCKER_SCHEMA1_FORMAT_TAIL_KEY = 'formatTail'
 # Keys for manifest-related data
 DOCKER_SCHEMA1_REPO_NAME_KEY = 'name'
 DOCKER_SCHEMA1_REPO_TAG_KEY = 'tag'
 DOCKER_SCHEMA1_ARCH_KEY = 'architecture'
 DOCKER_SCHEMA1_FS_LAYERS_KEY = 'fsLayers'
 DOCKER_SCHEMA1_BLOB_SUM_KEY = 'blobSum'
 DOCKER_SCHEMA1_HISTORY_KEY = 'history'
 DOCKER_SCHEMA1_V1_COMPAT_KEY = 'v1Compatibility'
 DOCKER_SCHEMA1_SCHEMA_VER_KEY = 'schemaVersion'
-# These are used to extract backwards compatiblity data from Docker Manifest Schema 1
+# Format for time used in the protected payload.
 ExtractedLayerMetadata = namedtuple(
  'ExtractedLayerMetadata',
  ['digest', 'v1_metadata', 'v1_metadata_str']
 )
 ExtractedDockerV1Metadata = namedtuple(
  'ExtractedDockerV1Metadata',
  ['image_id', 'parent_image_id', 'created', 'comment', 'command']
 )
 # Constants used for Docker Manifest Schema 2.1
 _DOCKER_SCHEMA_1_SIGNATURES_KEY = 'signatures'
 _DOCKER_SCHEMA_1_PROTECTED_KEY = 'protected'
 _DOCKER_SCHEMA_1_FORMAT_LENGTH_KEY = 'formatLength'
 _DOCKER_SCHEMA_1_FORMAT_TAIL_KEY = 'formatTail'
 _DOCKER_SCHEMA_1_REPO_NAME_KEY = 'name'
 _DOCKER_SCHEMA_1_REPO_TAG_KEY = 'tag'
 _DOCKER_SCHEMA_1_FS_LAYERS_KEY = 'fsLayers'
 _DOCKER_SCHEMA_1_HISTORY_KEY = 'history'
 _DOCKER_SCHEMA_1_BLOB_SUM_KEY = 'blobSum'
 _DOCKER_SCHEMA_1_V1_COMPAT_KEY = 'v1Compatibility'
 _DOCKER_SCHEMA_1_ARCH_KEY = 'architecture'
 _DOCKER_SCHEMA_1_SCHEMA_VER_KEY = 'schemaVersion'
 _ISO_DATETIME_FORMAT_ZULU = '%Y-%m-%dT%H:%M:%SZ'
-_JWS_ALGORITHM = 'RS256'
+
 # The algorithm we use to sign the JWS.
 _JWS_SIGNING_ALGORITHM = 'RS256'
-class ManifestException(Exception):
+class MalformedSchema1Manifest(ManifestException):
  """
  Raised when a manifest fails an assertion that should be true according to the Docker Manifest
  v2.1 Specification.
  """
  pass
-class ManifestMalformed(ManifestException):
+class InvalidSchema1Signature(ManifestException):
  """
  Raised when there is a failure verifying the signature of a signed Docker 2.1 Manifest.
  """
  pass
-class ManifestSignatureFailure(ManifestException):
+class Schema1Layer(namedtuple('Schema1Layer', ['digest', 'v1_metadata', 'raw_v1_metadata'])):
-  pass
+  """
  Represents all of the data about an individual layer in a given Manifest.
  This is the union of the fsLayers (digest) and the history entries (v1_compatibility).
  """
-def _updated_v1_metadata(v1_metadata_json, updated_id_map):
+class Schema1V1Metadata(namedtuple('Schema1V1Metadata', ['image_id', 'parent_image_id', 'created',
-  parsed = json.loads(v1_metadata_json)
+                                                         'comment', 'command'])):
-  parsed['id'] = updated_id_map[parsed['id']]
+  """
-
+  Represents the necessary data extracted from the v1 compatibility string in a given layer of a
-  if parsed.get('parent') and parsed['parent'] in updated_id_map:
+  Manifest.
-    parsed['parent'] = updated_id_map[parsed['parent']]
+  """
  if parsed.get('container_config', {}).get('Image'):
    existing_image = parsed['container_config']['Image']
    if existing_image in updated_id_map:
      parsed['container_config']['image'] = updated_id_map[existing_image]
  return json.dumps(parsed)
 class DockerSchema1Manifest(object):
@ -83,17 +89,18 @@ class DockerSchema1Manifest(object):
    self._bytes = manifest_bytes
    self._parsed = json.loads(manifest_bytes)
-    self._signatures = self._parsed[_DOCKER_SCHEMA_1_SIGNATURES_KEY]
+    self._signatures = self._parsed[DOCKER_SCHEMA1_SIGNATURES_KEY]
-    self._tag = self._parsed[_DOCKER_SCHEMA_1_REPO_TAG_KEY]
+    self._tag = self._parsed[DOCKER_SCHEMA1_REPO_TAG_KEY]
-    repo_name_tuple = self._parsed[_DOCKER_SCHEMA_1_REPO_NAME_KEY].split('/')
+    repo_name = self._parsed[DOCKER_SCHEMA1_REPO_NAME_KEY]
    repo_name_tuple = repo_name.split('/')
    if len(repo_name_tuple) > 1:
      self._namespace, self._repo_name = repo_name_tuple
    elif len(repo_name_tuple) == 1:
      self._namespace = ''
      self._repo_name = repo_name_tuple[0]
    else:
-      raise ManifestMalformed('malformed repository name')
+      raise MalformedSchema1Manifest('malformed repository name: %s' % repo_name)
    if validate:
      self._validate()
@ -108,7 +115,11 @@ class DockerSchema1Manifest(object):
      sig = base64url_decode(signature['signature'].encode('utf-8'))
      verified = signer.verify(bytes_to_verify, sig, gk)
      if not verified:
-        raise ManifestSignatureFailure()
+        raise InvalidSchema1Signature()
  @property
  def content_type(self):
    return DOCKER_SCHEMA1_SIGNED_MANIFEST_CONTENT_TYPE
  @property
  def signatures(self):
@ -151,6 +162,10 @@ class DockerSchema1Manifest(object):
  def checksums(self):
    return list({str(mdata.digest) for mdata in self.layers})
  @property
  def leaf_layer(self):
    return self.layers[-1]
  @property
  def layers(self):
    if self._layers is None:
@ -158,38 +173,39 @@ class DockerSchema1Manifest(object):
    return self._layers
  def _generate_layers(self):
    """ Returns a generator of objects that have the blobSum and v1Compatibility keys in them,
        starting from the base image and working toward the leaf node.
    """
-    for blob_sum_obj, history_obj in reversed(zip(self._parsed[_DOCKER_SCHEMA_1_FS_LAYERS_KEY],
+    Returns a generator of objects that have the blobSum and v1Compatibility keys in them,
-                                                  self._parsed[_DOCKER_SCHEMA_1_HISTORY_KEY])):
+    starting from the base image and working toward the leaf node.
    """
    for blob_sum_obj, history_obj in reversed(zip(self._parsed[DOCKER_SCHEMA1_FS_LAYERS_KEY],
                                                  self._parsed[DOCKER_SCHEMA1_HISTORY_KEY])):
      try:
-        image_digest = digest_tools.Digest.parse_digest(blob_sum_obj[_DOCKER_SCHEMA_1_BLOB_SUM_KEY])
+        image_digest = digest_tools.Digest.parse_digest(blob_sum_obj[DOCKER_SCHEMA1_BLOB_SUM_KEY])
      except digest_tools.InvalidDigestException:
-        raise ManifestMalformed('could not parse manifest digest: %s' %
+        raise MalformedSchema1Manifest('could not parse manifest digest: %s' %
-                                blob_sum_obj[_DOCKER_SCHEMA_1_BLOB_SUM_KEY])
+                                       blob_sum_obj[DOCKER_SCHEMA1_BLOB_SUM_KEY])
-      metadata_string = history_obj[_DOCKER_SCHEMA_1_V1_COMPAT_KEY]
+      metadata_string = history_obj[DOCKER_SCHEMA1_V1_COMPAT_KEY]
      v1_metadata = json.loads(metadata_string)
      command_list = v1_metadata.get('container_config', {}).get('Cmd', None)
      command = json.dumps(command_list) if command_list else None
      if not 'id' in v1_metadata:
-        raise ManifestMalformed('invalid manifest v1 history')
+        raise MalformedSchema1Manifest('id field missing from v1Compatibility JSON')
-      extracted = ExtractedDockerV1Metadata(v1_metadata['id'], v1_metadata.get('parent'),
+      extracted = Schema1V1Metadata(v1_metadata['id'], v1_metadata.get('parent'),
-                                            v1_metadata.get('created'), v1_metadata.get('comment'),
+                                    v1_metadata.get('created'), v1_metadata.get('comment'),
-                                            command)
+                                    command)
-      yield ExtractedLayerMetadata(image_digest, extracted, metadata_string)
+      yield Schema1Layer(image_digest, extracted, metadata_string)
  @property
  def payload(self):
-    protected = str(self._signatures[0][_DOCKER_SCHEMA_1_PROTECTED_KEY])
+    protected = str(self._signatures[0][DOCKER_SCHEMA1_PROTECTED_KEY])
    parsed_protected = json.loads(base64url_decode(protected))
-    signed_content_head = self._bytes[:parsed_protected[_DOCKER_SCHEMA_1_FORMAT_LENGTH_KEY]]
+    signed_content_head = self._bytes[:parsed_protected[DOCKER_SCHEMA1_FORMAT_LENGTH_KEY]]
-    signed_content_tail = base64url_decode(str(parsed_protected[_DOCKER_SCHEMA_1_FORMAT_TAIL_KEY]))
+    signed_content_tail = base64url_decode(str(parsed_protected[DOCKER_SCHEMA1_FORMAT_TAIL_KEY]))
    return signed_content_head + signed_content_tail
  def rewrite_invalid_image_ids(self, images_map):
@ -205,15 +221,15 @@ class DockerSchema1Manifest(object):
    has_rewritten_ids = False
    updated_id_map = {}
-    for extracted_layer_metadata in self.layers:
+    for layer in self.layers:
-      digest_str = str(extracted_layer_metadata.digest)
+      digest_str = str(layer.digest)
-      extracted_v1_metadata = extracted_layer_metadata.v1_metadata
+      extracted_v1_metadata = layer.v1_metadata
      working_image_id = extracted_v1_metadata.image_id
      # Update our digest_history hash for the new layer data.
      digest_history.update(digest_str)
      digest_history.update("@")
-      digest_history.update(extracted_layer_metadata.v1_metadata_str.encode('utf-8'))
+      digest_history.update(layer.raw_v1_metadata.encode('utf-8'))
      digest_history.update("|")
      # Ensure that the v1 image's storage matches the V2 blob. If not, we've
@ -233,12 +249,11 @@ class DockerSchema1Manifest(object):
      if extracted_v1_metadata.parent_image_id is not None:
        parent_image_id = images_map.get(extracted_v1_metadata.parent_image_id, None)
        if parent_image_id is None:
-          raise ManifestMalformed(
+          raise MalformedSchema1Manifest('parent not found with image ID: %s' %
-            'Parent not found with image ID: {0}'.format(extracted_v1_metadata.parent_image_id)
+                                         extracted_v1_metadata.parent_image_id)
          )
      # Synthesize and store the v1 metadata in the db.
-      v1_metadata_json = extracted_layer_metadata.v1_metadata_str
+      v1_metadata_json = layer.raw_v1_metadata
      if has_rewritten_ids:
        v1_metadata_json = _updated_v1_metadata(v1_metadata_json, updated_id_map)
@ -253,17 +268,19 @@ class DockerSchema1Manifest(object):
 class DockerSchema1ManifestBuilder(object):
-  """ Class which represents a manifest which is currently being built. """
+  """
  A convenient abstraction around creating new DockerSchema1Manifests.
  """
  def __init__(self, namespace_name, repo_name, tag, architecture='amd64'):
    repo_name_key = '{0}/{1}'.format(namespace_name, repo_name)
    if namespace_name == '':
      repo_name_key = repo_name
    self._base_payload = {
-      _DOCKER_SCHEMA_1_REPO_TAG_KEY: tag,
+      DOCKER_SCHEMA1_REPO_TAG_KEY: tag,
-      _DOCKER_SCHEMA_1_REPO_NAME_KEY: repo_name_key,
+      DOCKER_SCHEMA1_REPO_NAME_KEY: repo_name_key,
-      _DOCKER_SCHEMA_1_ARCH_KEY: architecture,
+      DOCKER_SCHEMA1_ARCH_KEY: architecture,
-      _DOCKER_SCHEMA_1_SCHEMA_VER_KEY: 1,
+      DOCKER_SCHEMA1_SCHEMA_VER_KEY: 1,
    }
    self._fs_layer_digests = []
@ -271,21 +288,22 @@ class DockerSchema1ManifestBuilder(object):
  def add_layer(self, layer_digest, v1_json_metadata):
    self._fs_layer_digests.append({
-      _DOCKER_SCHEMA_1_BLOB_SUM_KEY: layer_digest,
+      DOCKER_SCHEMA1_BLOB_SUM_KEY: layer_digest,
    })
    self._history.append({
-      _DOCKER_SCHEMA_1_V1_COMPAT_KEY: v1_json_metadata,
+      DOCKER_SCHEMA1_V1_COMPAT_KEY: v1_json_metadata,
    })
    return self
  def build(self, json_web_key):
-    """ Build the payload and sign it, returning a SignedManifest object.
+    """
    Builds a DockerSchema1Manifest object complete with signature.
    """
    payload = OrderedDict(self._base_payload)
    payload.update({
-      _DOCKER_SCHEMA_1_HISTORY_KEY: self._history,
+      DOCKER_SCHEMA1_HISTORY_KEY: self._history,
-      _DOCKER_SCHEMA_1_FS_LAYERS_KEY: self._fs_layer_digests,
+      DOCKER_SCHEMA1_FS_LAYERS_KEY: self._fs_layer_digests,
    })
    payload_str = json.dumps(payload, indent=3)
@ -302,7 +320,7 @@ class DockerSchema1ManifestBuilder(object):
    bytes_to_sign = '{0}.{1}'.format(protected, base64url_encode(payload_str))
-    signer = SIGNER_ALGS[_JWS_ALGORITHM]
+    signer = SIGNER_ALGS[_JWS_SIGNING_ALGORITHM]
    signature = base64url_encode(signer.sign(bytes_to_sign, json_web_key.get_key()))
    logger.debug('Generated signature: %s', signature)
@ -311,48 +329,31 @@ class DockerSchema1ManifestBuilder(object):
                  if comp in public_members}
    signature_block = {
-      'header': {
+      DOCKER_SCHEMA1_HEADER_KEY: {'jwk': public_key, 'alg': _JWS_SIGNING_ALGORITHM},
-        'jwk': public_key,
+      DOCKER_SCHEMA1_SIGNATURE_KEY: signature,
-        'alg': _JWS_ALGORITHM,
+      DOCKER_SCHEMA1_PROTECTED_KEY: protected,
      },
      'signature': signature,
      _DOCKER_SCHEMA_1_PROTECTED_KEY: protected,
    }
    logger.debug('Encoded signature block: %s', json.dumps(signature_block))
-    payload.update({
+    payload.update({DOCKER_SCHEMA1_SIGNATURES_KEY: [signature_block]})
      _DOCKER_SCHEMA_1_SIGNATURES_KEY: [signature_block],
    })
    return DockerSchema1Manifest(json.dumps(payload, indent=3))
-Repository = namedtuple('Repository', ['id', 'name', 'namespace_name'])
+def _updated_v1_metadata(v1_metadata_json, updated_id_map):
  """
  Updates v1_metadata with new image IDs.
  """
  parsed = json.loads(v1_metadata_json)
  parsed['id'] = updated_id_map[parsed['id']]
-Tag = namedtuple('Tag', ['name', 'repository'])
+  if parsed.get('parent') and parsed['parent'] in updated_id_map:
    parsed['parent'] = updated_id_map[parsed['parent']]
-ManifestJSON = namedtuple('ManifestJSON', ['digest', 'json'])
+  if parsed.get('container_config', {}).get('Image'):
    existing_image = parsed['container_config']['Image']
    if existing_image in updated_id_map:
      parsed['container_config']['image'] = updated_id_map[existing_image]
-DockerV1Metadata = namedtuple('DockerV1Metadata', ['namespace_name',
+  return json.dumps(parsed)
                                                   'repo_name',
                                                   'image_id',
                                                   'checksum',
                                                   'content_checksum',
                                                   'created',
                                                   'comment',
                                                   'command',
                                                   'parent_image_id',
                                                   'compat_json'])
 BlobUpload = namedtuple('BlobUpload', ['uuid',
                                       'byte_count',
                                       'uncompressed_byte_count',
                                       'chunk_count',
                                       'sha_state',
                                       'location_name',
                                       'storage_metadata',
                                       'piece_sha_state',
                                       'piece_hashes'])
 Blob = namedtuple('Blob', ['digest', 'size', 'locations'])
--- a/image/docker/schema2.py
+++ b/image/docker/schema2.py
@ -0,0 +1,11 @@
 """
 schema2 implements pure data transformations according to the Docker Manifest v2.2 Specification.
 https://github.com/docker/distribution/blob/master/docs/spec/manifest-v2-2.md
 """
 # Content Types
 DOCKER_SCHEMA2_MANIFEST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.v2+json'
 DOCKER_SCHEMA2_MANIFESTLIST_CONTENT_TYPE = 'application/vnd.docker.distribution.manifest.list.v2+json'
 DOCKER_SCHEMA2_CONTENT_TYPES = [DOCKER_SCHEMA2_MANIFEST_CONTENT_TYPE,
                                DOCKER_SCHEMA2_MANIFESTLIST_CONTENT_TYPE]
--- a/image/docker/squashed.py
+++ b/image/docker/squashed.py
@ -1,30 +1,31 @@
 from app import app
 from util.registry.gzipwrap import GZIP_BUFFER_SIZE
 from util.registry.streamlayerformat import StreamLayerMerger
 from formats.tarimageformatter import TarImageFormatter
 import copy
 import json
 import math
 import calendar
 from app import app
 from image import TarImageFormatter
 from util.registry.gzipwrap import GZIP_BUFFER_SIZE
 from util.registry.streamlayerformat import StreamLayerMerger
 class FileEstimationException(Exception):
-  """ Exception raised by build_docker_load_stream if the estimated size of the layer TAR
+  """
-      was lower than the actual size. This means the sent TAR header is wrong, and we have
+  Exception raised by build_docker_load_stream if the estimated size of the layer tar was lower
-      to fail.
+  than the actual size. This means the sent tar header is wrong, and we have to fail.
  """
  pass
-class SquashedDockerImage(TarImageFormatter):
+class SquashedDockerImageFormatter(TarImageFormatter):
-  """ Image formatter which produces a squashed image compatible with the `docker load`
+  """
-      command.
+  Image formatter which produces a squashed image compatible with the `docker load` command.
  """
-  # Multiplier against the image size reported by Docker to account for the TAR metadata.
+  # Multiplier against the image size reported by Docker to account for the tar metadata.
  # Note: This multiplier was not formally calculated in anyway and should be adjusted overtime
  # if/when we encounter issues with it. Unfortunately, we cannot make it too large or the Docker
-  # daemon dies when trying to load the entire TAR into memory.
+  # daemon dies when trying to load the entire tar into memory.
  SIZE_MULTIPLIER = 1.2
  def stream_generator(self, namespace, repository, tag, synthetic_image_id,
@ -39,7 +40,7 @@ class SquashedDockerImage(TarImageFormatter):
    #  repositories - JSON file containing a repo -> tag -> image map
    #  {image ID folder}:
    #     json - The layer JSON
-    #     layer.tar - The TARed contents of the layer
+    #     layer.tar - The tared contents of the layer
    #     VERSION - The docker import version: '1.0'
    layer_merger = StreamLayerMerger(get_layer_iterator)
@ -57,7 +58,7 @@ class SquashedDockerImage(TarImageFormatter):
    yield self.tar_folder(synthetic_image_id, mtime=image_mtime)
    # Yield the JSON layer data.
-    layer_json = SquashedDockerImage._build_layer_json(layer_json, synthetic_image_id)
+    layer_json = SquashedDockerImageFormatter._build_layer_json(layer_json, synthetic_image_id)
    yield self.tar_file(synthetic_image_id + '/json', json.dumps(layer_json), mtime=image_mtime)
    # Yield the VERSION file.
@ -73,7 +74,7 @@ class SquashedDockerImage(TarImageFormatter):
        estimated_file_size += image.storage.uncompressed_size
      else:
        image_json = get_image_json(image)
-        estimated_file_size += image_json.get('Size', 0) * SquashedDockerImage.SIZE_MULTIPLIER
+        estimated_file_size += image_json.get('Size', 0) * SquashedDockerImageFormatter.SIZE_MULTIPLIER
    # Make sure the estimated file size is an integer number of bytes.
    estimated_file_size = int(math.ceil(estimated_file_size))
@ -105,7 +106,7 @@ class SquashedDockerImage(TarImageFormatter):
    # Yield any file padding to 512 bytes that is necessary.
    yield self.tar_file_padding(estimated_file_size)
-    # Last two records are empty in TAR spec.
+    # Last two records are empty in tar spec.
    yield '\0' * 512
    yield '\0' * 512
--- a/image/docker/v1.py
+++ b/image/docker/v1.py
@ -0,0 +1,16 @@
 """
 v1 implements pure data transformations according to the Docker Image Specification v1.1.
 https://github.com/docker/docker/blob/master/image/spec/v1.1.md
 """
 from collections import namedtuple
 class DockerV1Metadata(namedtuple('DockerV1Metadata',
                                  ['namespace_name', 'repo_name', 'image_id', 'checksum',
                                   'content_checksum', 'created', 'comment', 'command',
                                   'parent_image_id', 'compat_json'])):
  """
  DockerV1Metadata represents all of the metadata for a given Docker v1 Image.
  The original form of the metadata is stored in the compat_json field.
  """