import pandas as pd
import numpy as np
# Sett seed for reproduserbarhet
np.random.seed(42)
# Definer størrelsen på hver gruppe
n_adhd = 100
n_controls = 50
# Generer demografiske data
age_adhd = np.random.randint(18, 50, size=n_adhd)
age_controls = np.random.randint(18, 50, size=n_controls)
gender_adhd = np.random.choice(['Mann', 'Kvinne'], size=n_adhd)
gender_controls = np.random.choice(['Mann', 'Kvinne'], size=n_controls)
education_levels = ['Grunnskole', 'Videregående', 'Bachelor', 'Master']
education_adhd = np.random.choice(education_levels, size=n_adhd)
education_controls = np.random.choice(education_levels, size=n_controls)
# ADHD-relaterte data
adhd_subtype = np.random.choice(['Uoppmerksom', 'Hyperaktiv-impulsiv', 'Kombinert'], size=n_adhd)
adhd_diagnosis_age = np.random.randint(4, 18, size=n_adhd)
adhd_medication = np.random.choice(['Ja', 'Nei'], size=n_adhd)
adhd_severity = np.random.randint(1, 4, size=n_adhd) # 1: Lav, 2: Moderat, 3: Høy
# Kognitiv funksjon
working_memory_adhd = np.random.uniform(5, 10, size=n_adhd)
working_memory_controls = np.random.uniform(5, 10, size=n_controls)
attention_control_adhd = np.random.uniform(5, 10, size=n_adhd)
attention_control_controls = np.random.uniform(5, 10, size=n_controls)
executive_functions_adhd = np.random.uniform(5, 10, size=n_adhd)
executive_functions_controls = np.random.uniform(5, 10, size=n_controls)
# Psykisk helse
comorbid_disorders_adhd = np.random.choice(['Ingen', 'Angst', 'Depresjon', 'Både angst og depresjon'], size=n_adhd)
comorbid_disorders_controls = np.random.choice(['Ingen', 'Angst', 'Depresjon', 'Både angst og depresjon'], size=n_controls)
# Livsstil og sosial fungering
physical_activity_adhd = np.random.choice(['Lav', 'Moderat', 'Høy'], size=n_adhd)
physical_activity_controls = np.random.choice(['Lav', 'Moderat', 'Høy'], size=n_controls)
sleep_quality_adhd = np.random.choice(['Dårlig', 'Moderat', 'God'], size=n_adhd)
sleep_quality_controls = np.random.choice(['Dårlig', 'Moderat', 'God'], size=n_controls)
social_functioning_adhd = np.random.uniform(0, 100, size=n_adhd)
social_functioning_controls = np.random.uniform(0, 100, size=n_controls)
# Biologiske målinger
blood_pressure_adhd = np.random.randint(90, 140, size=n_adhd)
blood_pressure_controls = np.random.randint(90, 140, size=n_controls)
bmi_adhd = np.random.uniform(18, 30, size=n_adhd)
bmi_controls = np.random.uniform(18, 30, size=n_controls)
# Kombiner dataene
data_adhd = pd.DataFrame({
'Gruppe': 'ADHD',
'Alder': age_adhd,
'Kjønn': gender_adhd,
'Utdanning': education_adhd,
'ADHD Subtype': adhd_subtype,
'Alder ved Diagnose': adhd_diagnosis_age,
'Medikamentbruk': adhd_medication,
'Severity Score': adhd_severity,
'Arbeidsminne': working_memory_adhd,
'Oppmerksomhetskontroll': attention_control_adhd,
'Eksekutive Funksjoner': executive_functions_adhd,
'Komorbide Lidelse': comorbid_disorders_adhd,
'Fysisk Aktivitet': physical_activity_adhd,
'Søvnkvalitet': sleep_quality_adhd,
'Sosial Funksjon': social_functioning_adhd,
'Blodtrykk': blood_pressure_adhd,
'BMI': bmi_adhd
})
data_controls = pd.DataFrame({
'Gruppe': 'Kontroll',
'Alder': age_controls,
'Kjønn': gender_controls,
'Utdanning': education_controls,
'ADHD Subtype': np.nan,
'Alder ved Diagnose': np.nan,
'Medikamentbruk': np.nan,
'Severity Score': np.nan,
'Arbeidsminne': working_memory_controls,
'Oppmerksomhetskontroll': attention_control_controls,
'Eksekutive Funksjoner': executive_functions_controls,
'Komorbide Lidelse': comorbid_disorders_controls,
'Fysisk Aktivitet': physical_activity_controls,
'Søvnkvalitet': sleep_quality_controls,
'Sosial Funksjon': social_functioning_controls,
'Blodtrykk': blood_pressure_controls,
'BMI': bmi_controls
})
# Slå sammen ADHD- og kontrollgruppen
dataset = pd.concat([data_adhd, data_controls]).reset_index(drop=True)
# Lagre datasettet som en CSV-fil
# csv_file_path = '/mnt/data/simulated_adhd_study_data.csv'
csv_file_path = 'simulated_adhd_study_data.csv'
dataset.to_csv(csv_file_path, index=False)
csv_file_path
dataset