gokulraja · March 27, 2020 15:27
diff --git a/excel2json b/excel2json
 import openpyxl
 import pandas as pd
 import json
 import ast

 wb = openpyxl.load_workbook(r'C:\Users\Ausu\Documents\C(Sharp) Projects\Sample_JsonGenMetadata.xltm')

 def getSheetNameTable():
    listofSheetName = []
    worksheet = wb["Metadata"]
    for tbl in worksheet._tables:
        if(tbl.name == "sheetName"):
            cellAddress = tbl.ref
            data_rows =[]
            for row in worksheet[cellAddress]:
                data_cols = []
                for cell in row:
                    data_cols.append(cell.value)
                data_rows.append(data_cols)
            for i in range(1,len(worksheet[cellAddress])):
                for item in worksheet[cellAddress][i]:
                    listofSheetName.append(item.value)
            return listofSheetName


 def getMetaDataTableToDictionary():
    requiredSheets = getSheetNameTable()
    ws = wb["Metadata"]
    for tbl in ws._tables:
        if(tbl.name == "tbl_Metadata"):
            cellAddress = tbl.ref

    data_rows = []
    for row in ws[cellAddress]:
        data_cols = []
        for cell in row:
            data_cols.append(cell.value)
        data_rows.append(data_cols)
    
    df = pd.DataFrame(data_rows)
    columnNames = df.iloc[0] 
    df = df[1:] 
    df.columns = columnNames
    getDf = df[df.SheetName.isin(requiredSheets)]
    for SheetName, df_sheetName in getDf.groupby('SheetName'):
        sheetName = df_sheetName.iat[0,0]
        print(df_sheetName.iat[0,0])
        getJson(df_sheetName,sheetName)
        

 def getIgnoreColumnList(columnIgnoreCell,totalLengthOfColumn):
    totalcolumnNumber = []
    totalcolumnNumber = [x for x in range(totalLengthOfColumn)]
    if columnIgnoreCell is None:
        ignore = totalcolumnNumber
        return ignore
    else:
        if(isinstance(columnIgnoreCell, int)):
            ignore =  [columnIgnoreCell]
        else:
            test_ignore = columnIgnoreCell.split(",")
            ignore = [int(i) for i in test_ignore]
            
        totalcolumnNumber = set(totalcolumnNumber)
        ignore = set(ignore)
        return list(totalcolumnNumber - ignore)
    
 def getJson(dfOfSheet,sheetName):
    totalNameRanges = len(dfOfSheet.index)
    overallDict = {}
    overallDict["sheetName"] = str(sheetName)

    for nameRang in range(totalNameRanges):
        if(dfOfSheet.iat[nameRang,5] == "Yes"):
            dictJson = {} 
            worksheet = wb[dfOfSheet.iat[nameRang,0]]
            cellAddress = dfOfSheet.iat[nameRang,2]+":"+dfOfSheet.iat[nameRang,3]
            for i in range(0,len(worksheet[cellAddress])):
 #                dictJson["RowNo"] = 1
                listValue = []
                dummyList = []
                for item in worksheet[cellAddress][i]:
                    dummyList.append(str(item.value))
                acceptedCol = getIgnoreColumnList(dfOfSheet.iat[nameRang,4],len(dummyList))
                for actual in range(1,len(acceptedCol)):
                    listValue.append(str(dummyList[acceptedCol[actual]]))
                
                dictJson[dummyList[0]] = json.dumps(listValue)
                dictJson[dummyList[0]] = ast.literal_eval(dictJson[dummyList[0]])
                listNew = [dictJson]
 #                print(listNew)
                overallDict[dfOfSheet.iat[nameRang,1]+"("+str(dfOfSheet.iat[nameRang,4])+")"] = listNew
                jsonStr = json.dumps(overallDict).replace("],","]},{")
            if(nameRang):             
                jsonStr = jsonStr.replace("]}]},{","]}],")
 #                for rowno in range(1,len(worksheet[cellAddress])):
 #                    print(len(worksheet[cellAddress]))
 #                    rowN = rowno+1
 #                    jsonStr = jsonStr.replace("},{",'"RowNo":'+str(rowN)+",")
 #                jsonStr = jsonStr.replace(']"',']},{"')
                print(jsonStr)
    
    
 getMetaDataTableToDictionary()
    
 #v2
	import openpyxl
	import pandas as pd
	import json
	import ast

	wb = openpyxl.load_workbook(r'C:\Users\Ausu\Documents\C(Sharp) Projects\Sample_JsonGenMetadata.xltm')

	def getSheetNameTable():
	listofSheetName = []
	worksheet = wb["Metadata"]
	for tbl in worksheet._tables:
	if(tbl.name == "sheetName"):
	cellAddress = tbl.ref
	data_rows =[]
	for row in worksheet[cellAddress]:
	data_cols = []
	for cell in row:
	data_cols.append(cell.value)
	data_rows.append(data_cols)
	for i in range(1,len(worksheet[cellAddress])):
	for item in worksheet[cellAddress][i]:
	listofSheetName.append(item.value)
	return listofSheetName


	def getMetaDataTableToDictionary():
	requiredSheets = getSheetNameTable()
	ws = wb["Metadata"]
	for tbl in ws._tables:
	if(tbl.name == "tbl_Metadata"):
	cellAddress = tbl.ref

	data_rows = []
	for row in ws[cellAddress]:
	data_cols = []
	for cell in row:
	data_cols.append(cell.value)
	data_rows.append(data_cols)

	df = pd.DataFrame(data_rows)
	columnNames = df.iloc[0]
	df = df[1:]
	df.columns = columnNames
	getDf = df[df.SheetName.isin(requiredSheets)]
	for SheetName, df_sheetName in getDf.groupby('SheetName'):
	sheetName = df_sheetName.iat[0,0]
	print(df_sheetName.iat[0,0])
	getJson(df_sheetName,sheetName)


	def getIgnoreColumnList(columnIgnoreCell,totalLengthOfColumn):
	totalcolumnNumber = []
	totalcolumnNumber = [x for x in range(totalLengthOfColumn)]
	if columnIgnoreCell is None:
	ignore = totalcolumnNumber
	return ignore
	else:
	if(isinstance(columnIgnoreCell, int)):
	ignore = [columnIgnoreCell]
	else:
	test_ignore = columnIgnoreCell.split(",")
	ignore = [int(i) for i in test_ignore]

	totalcolumnNumber = set(totalcolumnNumber)
	ignore = set(ignore)
	return list(totalcolumnNumber - ignore)

	def getJson(dfOfSheet,sheetName):
	totalNameRanges = len(dfOfSheet.index)
	overallDict = {}
	overallDict["sheetName"] = str(sheetName)

	for nameRang in range(totalNameRanges):
	if(dfOfSheet.iat[nameRang,5] == "Yes"):
	dictJson = {}
	worksheet = wb[dfOfSheet.iat[nameRang,0]]
	cellAddress = dfOfSheet.iat[nameRang,2]+":"+dfOfSheet.iat[nameRang,3]
	for i in range(0,len(worksheet[cellAddress])):
	# dictJson["RowNo"] = 1
	listValue = []
	dummyList = []
	for item in worksheet[cellAddress][i]:
	dummyList.append(str(item.value))
	acceptedCol = getIgnoreColumnList(dfOfSheet.iat[nameRang,4],len(dummyList))
	for actual in range(1,len(acceptedCol)):
	listValue.append(str(dummyList[acceptedCol[actual]]))

	dictJson[dummyList[0]] = json.dumps(listValue)
	dictJson[dummyList[0]] = ast.literal_eval(dictJson[dummyList[0]])
	listNew = [dictJson]
	# print(listNew)
	overallDict[dfOfSheet.iat[nameRang,1]+"("+str(dfOfSheet.iat[nameRang,4])+")"] = listNew
	jsonStr = json.dumps(overallDict).replace("],","]},{")
	if(nameRang):
	jsonStr = jsonStr.replace("]}]},{","]}],")
	# for rowno in range(1,len(worksheet[cellAddress])):
	# print(len(worksheet[cellAddress]))
	# rowN = rowno+1
	# jsonStr = jsonStr.replace("},{",'"RowNo":'+str(rowN)+",")
	# jsonStr = jsonStr.replace(']"',']},{"')
	print(jsonStr)


	getMetaDataTableToDictionary()

	#v2