elizaOS
diff --git a/‎scripts/aggregate_temporal.py
+144 b/‎scripts/aggregate_temporal.py
+144
diff --git a/‎scripts/fetch_github.sh
100644100755 b/‎scripts/fetch_github.sh
100644100755
diff --git a/‎scripts/generate_history_summaries.sh
+45 b/‎scripts/generate_history_summaries.sh
+45
diff --git a/‎scripts/summarize.py
+6-6 b/‎scripts/summarize.py
+6-6
@@ -0,0 +1,144 @@
+import json
+from datetime import datetime, timedelta
+from collections import defaultdict
+from typing import Dict, List, Optional
+import argparse
+from copy import deepcopy
+
+def parse_timestamp(ts: str) -> datetime:
+    """Parse GitHub timestamp format to datetime"""
+    return datetime.strptime(ts, "%Y-%m-%dT%H:%M:%SZ")
+
+def get_activity_period(timestamp: str, period: str = "daily") -> str:
+    """Convert timestamp to period key (daily/weekly/monthly)"""
+    dt = parse_timestamp(timestamp)
+    if period == "daily":
+        return dt.strftime("%Y-%m-%d")
+    elif period == "weekly":
+        # Get start of week (Monday)
+        start = dt - timedelta(days=dt.weekday())
+        return start.strftime("%Y-%m-%d")
+    else:  # monthly
+        return dt.strftime("%Y-%m")
+
+def aggregate_contributor_data(data: Dict, period: str) -> Dict[str, List]:
+    """Aggregate contributor data by time period"""
+    period_data = defaultdict(lambda: defaultdict(lambda: {
+        "contributor": "",
+        "score": 0,
+        "summary": "",
+        "avatar_url": "",
+        "activity": {
+            "code": {
+                "total_commits": 0,
+                "total_prs": 0,
+                "commits": [],
+                "pull_requests": []
+            },
+            "issues": {
+                "total_opened": 0,
+                "opened": []
+            },
+            "engagement": {
+                "total_comments": 0,
+                "total_reviews": 0,
+                "comments": [],
+                "reviews": []
+            }
+        }
+    }))
+    
+    # Process each contributor
+    for contrib in data:
+        username = contrib["contributor"]
+        
+        # Process commits
+        for commit in contrib["activity"]["code"]["commits"]:
+            period_key = get_activity_period(commit["created_at"], period)
+            period_data[period_key][username]["contributor"] = username
+            period_data[period_key][username]["avatar_url"] = contrib["avatar_url"]
+            period_data[period_key][username]["activity"]["code"]["commits"].append(commit)
+            period_data[period_key][username]["activity"]["code"]["total_commits"] += 1
+        
+        # Process PRs
+        for pr in contrib["activity"]["code"]["pull_requests"]:
+            period_key = get_activity_period(pr["created_at"], period)
+            period_data[period_key][username]["contributor"] = username
+            period_data[period_key][username]["avatar_url"] = contrib["avatar_url"]
+            period_data[period_key][username]["activity"]["code"]["pull_requests"].append(pr)
+            period_data[period_key][username]["activity"]["code"]["total_prs"] += 1
+        
+        # Process issues
+        for issue in contrib["activity"]["issues"]["opened"]:
+            period_key = get_activity_period(issue["created_at"], period)
+            period_data[period_key][username]["contributor"] = username
+            period_data[period_key][username]["avatar_url"] = contrib["avatar_url"]
+            period_data[period_key][username]["activity"]["issues"]["opened"].append(issue)
+            period_data[period_key][username]["activity"]["issues"]["total_opened"] += 1
+    
+    # Convert defaultdict to regular dict and list structure
+    result = {}
+    for period_key, contributors in period_data.items():
+        result[period_key] = list(contributors.values())
+    
+    return result
+
+def save_period_data(data: Dict[str, List], output_dir: str, period: str):
+    """Save aggregated data to appropriate directories"""
+    import os
+    from pathlib import Path
+    
+    # Create directory structure
+    base_dir = Path(output_dir)
+    period_dir = base_dir / period
+    history_dir = period_dir / "history"
+    
+    os.makedirs(period_dir, exist_ok=True)
+    os.makedirs(history_dir, exist_ok=True)
+    
+    # Save each period's data
+    for date_key, contributors in data.items():
+        if not contributors:  # Skip empty periods
+            continue
+            
+        # Save current data
+        current_file = period_dir / "scored.json"
+        with open(current_file, 'w') as f:
+            json.dump(contributors, f, indent=2)
+        
+        # Save historical copy
+        history_file = history_dir / f"scored_{date_key}.json"
+        with open(history_file, 'w') as f:
+            json.dump(contributors, f, indent=2)
+
+def main():
+    parser = argparse.ArgumentParser(description="Aggregate GitHub activity data by time period")
+    parser.add_argument("input_file", help="Input contributors JSON file")
+    parser.add_argument("output_dir", help="Output directory for aggregated data")
+    parser.add_argument("--periods", nargs="+", choices=["daily", "weekly", "monthly"],
+                       default=["daily", "weekly", "monthly"],
+                       help="Time periods to generate")
+    args = parser.parse_args()
+    
+    # Load data
+    print(f"\nLoading data from {args.input_file}...")
+    with open(args.input_file) as f:
+        data = json.load(f)
+    
+    # Process each time period
+    for period in args.periods:
+        print(f"\nProcessing {period} aggregation...")
+        aggregated = aggregate_contributor_data(data, period)
+        
+        print(f"Saving {period} data...")
+        save_period_data(aggregated, args.output_dir, period)
+        
+        # Print some stats
+        total_periods = len(aggregated)
+        total_contributions = sum(len(contributors) for contributors in aggregated.values())
+        print(f"Generated {total_periods} {period} periods with {total_contributions} total contributions")
+    
+    print("\nProcessing complete!")
+
+if __name__ == "__main__":
+    main()
@@ -0,0 +1,45 @@
+#!/bin/bash
+
+# Create directories if they don't exist
+mkdir -p data/{daily,weekly,monthly}/history
+
+# Function to process files for a given period
+process_historical() {
+    local period=$1
+    echo "Processing ${period} historical summaries..."
+    
+    for scored_file in data/${period}/history/scored_*.json; do
+        if [ -f "$scored_file" ]; then
+            # Extract date from filename
+            date=$(echo "$scored_file" | grep -o '[0-9]\{4\}-[0-9]\{2\}-[0-9]\{2\}')
+            
+            if [ ! -z "$date" ]; then
+                echo "Generating summary for $date..."
+                output_file="data/${period}/history/contributors_${date}.json"
+                
+                # Generate summary
+                python scripts/summarize.py -f \
+                    "$scored_file" \
+                    "$output_file" \
+                    --model ollama
+
+                if [ $? -eq 0 ]; then
+                    echo "✓ Processed $scored_file -> $output_file"
+                else
+                    echo "✗ Failed to process $scored_file"
+                fi
+            fi
+        fi
+    done
+}
+
+# Process each period type
+for period in daily weekly monthly; do
+    if ls data/${period}/history/scored_*.json 1> /dev/null 2>&1; then
+        process_historical $period
+    else
+        echo "No scored files found for ${period}"
+    fi
+done
+
+echo "All historical summaries processed!"
@@ -6,7 +6,7 @@
 from langchain_core.prompts import PromptTemplate
 from collections import defaultdict
 
-def get_contribution_stats(data: Dict, days: int = 45) -> Dict:
+def get_contribution_stats(data: Dict, days: int = 90) -> Dict:
     """Get high-level contribution statistics for time period"""
     cutoff_date = datetime.utcnow() - timedelta(days=days)
     stats = defaultdict(int)
@@ -71,7 +71,7 @@ def get_contribution_stats(data: Dict, days: int = 45) -> Dict:
         'areas': {k: list(v) for k, v in work_areas.items()}
     }
 
-def get_recent_activity(data: Dict, days: int = 45) -> List[str]:
+def get_recent_activity(data: Dict, days: int = 90) -> List[str]:
     """Get most relevant recent activity"""
     cutoff_date = datetime.utcnow() - timedelta(days=days)
     activity = []
@@ -159,7 +159,7 @@ def get_summary_prompt(data: Dict, activity: List[str], stats: Dict) -> str:
     if stats['areas'].get('issue_areas'):
         areas_str += f"\nIssue areas: {', '.join(stats['areas']['issue_areas'])}"
 
-    return f"""Based on this GitHub activity from the last 45 days, write a 2-3 sentence summary of what {data['contributor']} worked on:
+    return f"""Based on this GitHub activity from the last 90 days, write a 2-3 sentence summary of what {data['contributor']} worked on:
 
 Recent Activity (most significant first):
 {chr(10).join(activity)}
@@ -176,12 +176,12 @@ def get_summary_prompt(data: Dict, activity: List[str], stats: Dict) -> str:
 def generate_summary(data: Dict, model: str, api_key: str = None) -> str:
     """Generate summary using specified model"""
     try:
-        activity = get_recent_activity(data, days=45)
-        stats = get_contribution_stats(data, days=45)
+        activity = get_recent_activity(data, days=90)
+        stats = get_contribution_stats(data, days=90)
 
         # If no activity was found, return early
         if not activity:
-            return f"{data['contributor']} has no significant activity in the last 45 days."
+            return f"{data['contributor']} has no significant activity in the last 90 days."
 
         if model == "openai":
             from openai import OpenAI