jimmy shen liketheflower

Data Scientist, Software Engineer

liketheflower / CartPole_ppo.py

Created August 3, 2022 02:05

	from stable_baselines3 import PPO
	import gym

	env = gym.make("CartPole-v1")

	model = PPO(policy = "MlpPolicy",env = env, verbose=1)
	model.learn(total_timesteps=25000)

	model.save("ppo_cartpole") # saving the model to ppo_cartpole.zip
	model = PPO.load("ppo_cartpole") # loading the model from ppo_cartpole.zip

liketheflower / ppo_moutain_race.py

Created August 2, 2022 03:55

	import gym

	from stable_baselines3 import PPO
	from stable_baselines3.ppo import MlpPolicy
	from stable_baselines3.common.env_util import make_vec_env


	import os
	import time

liketheflower / print.py

Created August 2, 2022 01:08

liketheflower / plot_observations.py

Created August 2, 2022 00:44

	import gym
	import time
	import numpy as np
	import matplotlib.pyplot as plt

	env = gym.make("MountainCar-v0")
	env.reset()
	observations = []
	for t in range(1000):
	# env.render()

liketheflower / mountain_car.py

Last active August 2, 2022 00:32

	import gym
	import time

	env = gym.make('MountainCar-v0')
	env.reset()
	for t in range(10):
	print("-"20 + " "+ str(t) + " "+ "-"20)
	env.render()
	observation = env.reset()
	action = env.action_space.sample()

liketheflower / show_number_env.py

Created August 2, 2022 00:21

	import gym

	envs = gym.envs.registry.all()
	print(f"In total we have {len(envs)} envs available!")
	print(f"The first 4 envs are: ")
	for i, env in enumerate(list(envs)[:4]):
	print("-" * 20)
	print(env)

liketheflower / top_down.py

Created January 10, 2020 06:38

	from functools import lru_cache
	class Solution:
	def largestSumOfAverages(self, a: List[int], k: int) -> float:
	cusum = list(itertools.accumulate([0]+a))
	@lru_cache(None)
	def dp(i, k):
	#if i>=len(a):return 0
	if k == 1:return (cusum[-1]-cusum[i])/(len(a)-i)
	return max((cusum[j+1]-cusum[i])/(j-i+1) + dp(j+1, k-1) for j in range(i, len(a)-k+1))

liketheflower / bottom.py

Created January 10, 2020 06:37

	class Solution:
	def largestSumOfAverages(self, a: List[int], k: int) -> float:
	cusum = list(itertools.accumulate([0]+a))
	N=len(a)
	#dp[0][k] means from 0 to N-1 inclusively we have at most k groups
	# dp[0][k] = maximum of below cases
	#average(a[:1])+dp[1][k-1] from 1 to N-1 inclusively we have at most k-1 groups
	#average(a[:2])+dp[2][k-1] from 2 to N-1 inclusively we have at most k-1 groups
	#...
	#average(a[:N-1])+dp[N-1][k-1] from N-1 to N-1 inclusively we have at most k-1 groups

liketheflower / sol3.py

Created December 16, 2019 15:49

	from functools import lru_cache
	@lru_cache(None)
	def abbreviation(a, b):
	def dp(i,j):
	if i==0 and j==0:return True
	if i==0:return False
	if j==0:
	if a[i-1].islower():return dp(i-1, j)
	else:return False
	if a[i-1]==b[j-1]:

liketheflower / sol3.py

Last active December 16, 2019 15:33