mattbillenstein · December 6, 2018 18:53 · nvictor · Dec 6, 2018 · mattbillenstein · Dec 6, 2018
diff --git a/foo.py b/foo.py
 #!/usr/bin/env python3

 import json
 import time

 start = time.time()

 L = []

 i = 0
 with open('in.json') as f:
    for line in f:
        L.append(json.loads(line))
        i += 1
        if i % 100000 == 0:
            print(i)

 print('read', time.time() - start)
 L.sort(key=lambda x: x['id'])
 print('sort', time.time() - start)

 i = 0
 with open('out.json', 'w') as f:
    for d in L:
        f.write(json.dumps(d, sort_keys=True) + '\n')

        i += 1
        if i % 100000 == 0:
            print(i)

 print('write', time.time() - start)
	#!/usr/bin/env python3

	import json
	import time

	start = time.time()

	L = []

	i = 0
	with open('in.json') as f:
	for line in f:
	L.append(json.loads(line))
	i += 1
	if i % 100000 == 0:
	print(i)

	print('read', time.time() - start)
	L.sort(key=lambda x: x['id'])
	print('sort', time.time() - start)

	i = 0
	with open('out.json', 'w') as f:
	for d in L:
	f.write(json.dumps(d, sort_keys=True) + '\n')

	i += 1
	if i % 100000 == 0:
	print(i)

	print('write', time.time() - start)