From b2e3419bffb07c9737832d5807c46502dffca64e Mon Sep 17 00:00:00 2001
From: Pierre Tachoire <pierre@lightpanda.io>
Date: Tue, 11 Feb 2025 17:56:28 +0100
Subject: [PATCH 01/10] upgrade tigerbeetle

---
 src/server.zig        | 2 +-
 vendor/zig-js-runtime | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/src/server.zig b/src/server.zig
index bc58c64b..eb7c0a18 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -27,7 +27,7 @@ const AcceptError = jsruntime.IO.AcceptError;
 const RecvError = jsruntime.IO.RecvError;
 const SendError = jsruntime.IO.SendError;
 const CloseError = jsruntime.IO.CloseError;
-const CancelError = jsruntime.IO.CancelError;
+const CancelError = jsruntime.IO.CancelOneError;
 const TimeoutError = jsruntime.IO.TimeoutError;
 
 const MsgBuffer = @import("msg.zig").Buffer;
diff --git a/vendor/zig-js-runtime b/vendor/zig-js-runtime
index f40f4914..61c71e5e 160000
--- a/vendor/zig-js-runtime
+++ b/vendor/zig-js-runtime
@@ -1 +1 @@
-Subproject commit f40f4914667f4fc7cd14ee0df0e76a2fd8d835b4
+Subproject commit 61c71e5e390316786a0c780d9135a45890bda846

From 94be7a0e799d148508f706ac2d6bbfacd3d4244a Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Thu, 6 Feb 2025 22:05:01 +0800
Subject: [PATCH 02/10] Make TCP server websocket-aware

Adding HTTP & websocket awareness to the TCP server.

HTTP server handles `GET /json/version` and websocket upgrade requests.

Conceptually, websocket handling is the same code as before, but receiving
data will parse the websocket frames and writing data will wrap it in
a websocket frame.

The previous `Ctx` was split into a `Server` and a `Client`. This was
largely done to make it easy to write unit tests, since the `Client` is
a generic, all its dependencies (i.e. the server) can be mocked out. This
also makes it a bit nicer to know if there is or isn't a client (via the
server's client optional).

Added a MemoryPool for the Send object (I thought that was a nice touch!)

Removed MacOS hack on accept/conn completion usage.

Known issues:
- When framing an outgoing message, the entire message has to be duped. This
is no worse than how it was before, but it should be possible to eliminate
this in the future. Probably not part of this PR.

- Websocket parsing will reject continuation frames. I don't know of a single
client that will send a fragmented message (websocket has its own
message fragmentation), but we should probably still support this just in
case.

- I don't think the receive, timeout and close completions can safely be
re-used like we're doing. I believe they need to be associated with a specific
client socket.

- A new connection creates a new browser session. I think this is right (??),
but for the very first, we're throwing out a perfectly usable session. I'm
thinking this might be a change to how Browser/Sessions work.

- zig build test won't compile. This branch reproduces the issue with none
of these changes:
https://github.com/karlseguin/browser/tree/broken_test_build

(or, as a diff to main):
https://github.com/lightpanda-io/browser/compare/main...karlseguin:broken_test_build
---
 .gitmodules           |    4 -
 build.zig             |    5 -
 src/cdp/runtime.zig   |    4 +-
 src/handler.zig       |   95 ---
 src/main.zig          |   71 +-
 src/main_tests.zig    |    4 +-
 src/msg.zig           |  166 ----
 src/server.zig        | 1726 ++++++++++++++++++++++++++++++++---------
 src/unit_tests.zig    |    2 +-
 vendor/zig-js-runtime |    2 +-
 10 files changed, 1378 insertions(+), 701 deletions(-)
 delete mode 100644 src/handler.zig
 delete mode 100644 src/msg.zig

diff --git a/.gitmodules b/.gitmodules
index 184dd202..5743ca29 100644
--- a/.gitmodules
+++ b/.gitmodules
@@ -28,7 +28,3 @@
 [submodule "vendor/zig-async-io"]
 	path = vendor/zig-async-io
 	url = https://github.com/lightpanda-io/zig-async-io.git/
-[submodule "vendor/websocket.zig"]
-	path = vendor/websocket.zig
-	url = https://github.com/lightpanda-io/websocket.zig.git/
-	branch = lightpanda
diff --git a/build.zig b/build.zig
index 44e99222..adf4e26f 100644
--- a/build.zig
+++ b/build.zig
@@ -189,11 +189,6 @@ fn common(
         .root_source_file = b.path("vendor/tls.zig/src/main.zig"),
     });
     step.root_module.addImport("tls", tlsmod);
-
-    const wsmod = b.addModule("websocket", .{
-        .root_source_file = b.path("vendor/websocket.zig/src/websocket.zig"),
-    });
-    step.root_module.addImport("websocket", wsmod);
 }
 
 fn moduleNetSurf(b: *std.Build, target: std.Build.ResolvedTarget) !*std.Build.Module {
diff --git a/src/cdp/runtime.zig b/src/cdp/runtime.zig
index 44c1a907..054d5a78 100644
--- a/src/cdp/runtime.zig
+++ b/src/cdp/runtime.zig
@@ -131,12 +131,12 @@ fn sendInspector(
             const buf = try alloc.alloc(u8, msg.json.len + 1);
             defer alloc.free(buf);
             _ = std.mem.replace(u8, msg.json, "\"awaitPromise\":true", "\"awaitPromise\":false", buf);
-            ctx.sendInspector(buf);
+            try ctx.sendInspector(buf);
             return "";
         }
     }
 
-    ctx.sendInspector(msg.json);
+    try ctx.sendInspector(msg.json);
 
     if (msg.id == null) return "";
 
diff --git a/src/handler.zig b/src/handler.zig
deleted file mode 100644
index 0decb3f7..00000000
--- a/src/handler.zig
+++ /dev/null
@@ -1,95 +0,0 @@
-// Copyright (C) 2023-2024  Lightpanda (Selecy SAS)
-//
-// Francis Bouvier <francis@lightpanda.io>
-// Pierre Tachoire <pierre@lightpanda.io>
-//
-// This program is free software: you can redistribute it and/or modify
-// it under the terms of the GNU Affero General Public License as
-// published by the Free Software Foundation, either version 3 of the
-// License, or (at your option) any later version.
-//
-// This program is distributed in the hope that it will be useful,
-// but WITHOUT ANY WARRANTY; without even the implied warranty of
-// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
-// GNU Affero General Public License for more details.
-//
-// You should have received a copy of the GNU Affero General Public License
-// along with this program.  If not, see <https://www.gnu.org/licenses/>.
-
-const std = @import("std");
-
-const ws = @import("websocket");
-const Msg = @import("msg.zig").Msg;
-
-const log = std.log.scoped(.handler);
-
-pub const Stream = struct {
-    addr: std.net.Address,
-    socket: std.posix.socket_t = undefined,
-
-    ws_host: []const u8,
-    ws_port: u16,
-    ws_conn: *ws.Conn = undefined,
-
-    fn connectCDP(self: *Stream) !void {
-        const flags: u32 = std.posix.SOCK.STREAM;
-        const proto = blk: {
-            if (self.addr.any.family == std.posix.AF.UNIX) break :blk @as(u32, 0);
-            break :blk std.posix.IPPROTO.TCP;
-        };
-        const socket = try std.posix.socket(self.addr.any.family, flags, proto);
-
-        try std.posix.connect(
-            socket,
-            &self.addr.any,
-            self.addr.getOsSockLen(),
-        );
-        log.debug("connected to Stream server", .{});
-        self.socket = socket;
-    }
-
-    fn closeCDP(self: *const Stream) void {
-        const close_msg: []const u8 = .{ 5, 0, 0, 0 } ++ "close";
-        self.recv(close_msg) catch |err| {
-            log.err("stream close error: {any}", .{err});
-        };
-        std.posix.close(self.socket);
-    }
-
-    fn start(self: *Stream, ws_conn: *ws.Conn) !void {
-        try self.connectCDP();
-        self.ws_conn = ws_conn;
-    }
-
-    pub fn recv(self: *const Stream, data: []const u8) !void {
-        var pos: usize = 0;
-        while (pos < data.len) {
-            const len = try std.posix.write(self.socket, data[pos..]);
-            pos += len;
-        }
-    }
-
-    pub fn send(self: *const Stream, data: []const u8) !void {
-        return self.ws_conn.write(data);
-    }
-};
-
-pub const Handler = struct {
-    stream: *Stream,
-
-    pub fn init(_: ws.Handshake, ws_conn: *ws.Conn, stream: *Stream) !Handler {
-        try stream.start(ws_conn);
-        return .{ .stream = stream };
-    }
-
-    pub fn close(self: *Handler) void {
-        self.stream.closeCDP();
-    }
-
-    pub fn clientMessage(self: *Handler, data: []const u8) !void {
-        var header: [4]u8 = undefined;
-        Msg.setSize(data.len, &header);
-        try self.stream.recv(&header);
-        try self.stream.recv(data);
-    }
-};
diff --git a/src/main.zig b/src/main.zig
index e4da1df2..c5c04996 100644
--- a/src/main.zig
+++ b/src/main.zig
@@ -20,12 +20,9 @@ const std = @import("std");
 const builtin = @import("builtin");
 
 const jsruntime = @import("jsruntime");
-const websocket = @import("websocket");
 
 const Browser = @import("browser/browser.zig").Browser;
 const server = @import("server.zig");
-const handler = @import("handler.zig");
-const MaxSize = @import("msg.zig").MaxSize;
 
 const parser = @import("netsurf");
 const apiweb = @import("apiweb.zig");
@@ -86,11 +83,9 @@ const CliMode = union(CliModeTag) {
     const Server = struct {
         execname: []const u8 = undefined,
         args: *std.process.ArgIterator = undefined,
-        addr: std.net.Address = undefined,
         host: []const u8 = Host,
         port: u16 = Port,
         timeout: u8 = Timeout,
-        tcp: bool = false, // undocumented TCP mode
 
         // default options
         const Host = "127.0.0.1";
@@ -160,10 +155,6 @@ const CliMode = union(CliModeTag) {
                     return printUsageExit(execname, 1);
                 }
             }
-            if (std.mem.eql(u8, "--tcp", opt)) {
-                _server.tcp = true;
-                continue;
-            }
 
             // unknown option
             if (std.mem.startsWith(u8, opt, "--")) {
@@ -186,10 +177,6 @@ const CliMode = union(CliModeTag) {
         if (default_mode == .server) {
 
             // server mode
-            _server.addr = std.net.Address.parseIp4(_server.host, _server.port) catch |err| {
-                log.err("address (host:port) {any}\n", .{err});
-                return printUsageExit(execname, 1);
-            };
             _server.execname = execname;
             _server.args = args;
             return CliMode{ .server = _server };
@@ -247,65 +234,19 @@ pub fn main() !void {
 
     switch (cli_mode) {
         .server => |opts| {
-
-            // Stream server
-            const addr = blk: {
-                if (opts.tcp) {
-                    break :blk opts.addr;
-                } else {
-                    const unix_path = "/tmp/lightpanda";
-                    std.fs.deleteFileAbsolute(unix_path) catch {}; // file could not exists
-                    break :blk try std.net.Address.initUnix(unix_path);
-                }
-            };
-            const socket = server.listen(addr) catch |err| {
-                log.err("Server listen error: {any}\n", .{err});
+            const address = std.net.Address.parseIp4(opts.host, opts.port) catch |err| {
+                log.err("address (host:port) {any}\n", .{err});
                 return printUsageExit(opts.execname, 1);
             };
-            defer std.posix.close(socket);
-            log.debug("Server opts: listening internally on {any}...", .{addr});
 
-            const timeout = std.time.ns_per_s * @as(u64, opts.timeout);
-
-            // loop
             var loop = try jsruntime.Loop.init(alloc);
             defer loop.deinit();
 
-            // TCP server mode
-            if (opts.tcp) {
-                return server.handle(alloc, &loop, socket, null, timeout);
-            }
-
-            // start stream server in separate thread
-            var stream = handler.Stream{
-                .ws_host = opts.host,
-                .ws_port = opts.port,
-                .addr = addr,
+            const timeout = std.time.ns_per_s * @as(u64, opts.timeout);
+            server.run(alloc, address, timeout, &loop) catch |err| {
+                log.err("Server error", .{});
+                return err;
             };
-            const cdp_thread = try std.Thread.spawn(
-                .{ .allocator = alloc },
-                server.handle,
-                .{ alloc, &loop, socket, &stream, timeout },
-            );
-
-            // Websocket server
-            var ws = try websocket.Server(handler.Handler).init(alloc, .{
-                .port = opts.port,
-                .address = opts.host,
-                .max_message_size = MaxSize + 14, // overhead websocket
-                .max_conn = 1,
-                .handshake = .{
-                    .timeout = 3,
-                    .max_size = 1024,
-                    // since we aren't using hanshake.headers
-                    // we can set this to 0 to save a few bytes.
-                    .max_headers = 0,
-                },
-            });
-            defer ws.deinit();
-
-            try ws.listen(&stream);
-            cdp_thread.join();
         },
 
         .fetch => |opts| {
diff --git a/src/main_tests.zig b/src/main_tests.zig
index 3544cc6a..88acd1a5 100644
--- a/src/main_tests.zig
+++ b/src/main_tests.zig
@@ -314,9 +314,6 @@ const kb = 1024;
 const ms = std.time.ns_per_ms;
 
 test {
-    const msgTest = @import("msg.zig");
-    std.testing.refAllDecls(msgTest);
-
     const dumpTest = @import("browser/dump.zig");
     std.testing.refAllDecls(dumpTest);
 
@@ -340,6 +337,7 @@ test {
 
     std.testing.refAllDecls(@import("generate.zig"));
     std.testing.refAllDecls(@import("cdp/msg.zig"));
+    std.testing.refAllDecls(@import("server.zig"));
 }
 
 fn testJSRuntime(alloc: std.mem.Allocator) !void {
diff --git a/src/msg.zig b/src/msg.zig
deleted file mode 100644
index 13b7a62e..00000000
--- a/src/msg.zig
+++ /dev/null
@@ -1,166 +0,0 @@
-// Copyright (C) 2023-2024  Lightpanda (Selecy SAS)
-//
-// Francis Bouvier <francis@lightpanda.io>
-// Pierre Tachoire <pierre@lightpanda.io>
-//
-// This program is free software: you can redistribute it and/or modify
-// it under the terms of the GNU Affero General Public License as
-// published by the Free Software Foundation, either version 3 of the
-// License, or (at your option) any later version.
-//
-// This program is distributed in the hope that it will be useful,
-// but WITHOUT ANY WARRANTY; without even the implied warranty of
-// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
-// GNU Affero General Public License for more details.
-//
-// You should have received a copy of the GNU Affero General Public License
-// along with this program.  If not, see <https://www.gnu.org/licenses/>.
-
-const std = @import("std");
-
-pub const HeaderSize = 4;
-pub const MsgSize = 256 * 1204; // 256KB
-// NOTE: Theorically we could go up to 4GB with a 4 bytes binary encoding
-// but we prefer to put a lower hard limit for obvious memory size reasons.
-
-pub const MaxSize = HeaderSize + MsgSize;
-
-pub const Msg = struct {
-    pub fn getSize(data: []const u8) usize {
-        return std.mem.readInt(u32, data[0..HeaderSize], .little);
-    }
-
-    pub fn setSize(len: usize, header: *[4]u8) void {
-        std.mem.writeInt(u32, header, @intCast(len), .little);
-    }
-};
-
-/// Buffer returns messages from a raw text read stream,
-/// with the message size being encoded on the 2 first bytes (little endian)
-/// It handles both:
-/// - combined messages in one read
-/// - single message in several reads (multipart)
-/// It's safe (and a good practice) to reuse the same Buffer
-/// on several reads of the same stream.
-pub const Buffer = struct {
-    buf: []u8,
-    size: usize = 0,
-    pos: usize = 0,
-
-    fn isFinished(self: *const Buffer) bool {
-        return self.pos >= self.size;
-    }
-
-    fn isEmpty(self: *const Buffer) bool {
-        return self.size == 0 and self.pos == 0;
-    }
-
-    fn reset(self: *Buffer) void {
-        self.size = 0;
-        self.pos = 0;
-    }
-
-    // read input
-    pub fn read(self: *Buffer, input: []const u8) !struct {
-        msg: []const u8,
-        left: []const u8,
-    } {
-        var _input = input; // make input writable
-
-        // msg size
-        var msg_size: usize = undefined;
-        if (self.isEmpty()) {
-            // decode msg size header
-            msg_size = Msg.getSize(_input);
-            _input = _input[HeaderSize..];
-        } else {
-            msg_size = self.size;
-        }
-
-        // multipart
-        const is_multipart = !self.isEmpty() or _input.len < msg_size;
-        if (is_multipart) {
-
-            // set msg size on empty Buffer
-            if (self.isEmpty()) {
-                self.size = msg_size;
-            }
-
-            // get the new position of the cursor
-            const new_pos = self.pos + _input.len;
-
-            // check max limit size
-            if (new_pos > MaxSize) {
-                return error.MsgTooBig;
-            }
-
-            // copy the current input into Buffer
-            // NOTE: we could use @memcpy but it's not Thread-safe (alias problem)
-            // see https://www.openmymind.net/Zigs-memcpy-copyForwards-and-copyBackwards/
-            // Intead we just use std.mem.copyForwards
-            std.mem.copyForwards(u8, self.buf[self.pos..new_pos], _input[0..]);
-
-            // set the new cursor position
-            self.pos = new_pos;
-
-            // if multipart is not finished, go fetch the next input
-            if (!self.isFinished()) return error.MsgMultipart;
-
-            // otherwhise multipart is finished, use its buffer as input
-            _input = self.buf[0..self.pos];
-            self.reset();
-        }
-
-        // handle several JSON msg in 1 read
-        return .{ .msg = _input[0..msg_size], .left = _input[msg_size..] };
-    }
-};
-
-test "Buffer" {
-    const Case = struct {
-        input: []const u8,
-        nb: u8,
-    };
-
-    const cases = [_]Case{
-        // simple
-        .{ .input = .{ 2, 0, 0, 0 } ++ "ok", .nb = 1 },
-        // combined
-        .{ .input = .{ 2, 0, 0, 0 } ++ "ok" ++ .{ 3, 0, 0, 0 } ++ "foo", .nb = 2 },
-        // multipart
-        .{ .input = .{ 9, 0, 0, 0 } ++ "multi", .nb = 0 },
-        .{ .input = "part", .nb = 1 },
-        // multipart & combined
-        .{ .input = .{ 9, 0, 0, 0 } ++ "multi", .nb = 0 },
-        .{ .input = "part" ++ .{ 2, 0, 0, 0 } ++ "ok", .nb = 2 },
-        // multipart & combined with other multipart
-        .{ .input = .{ 9, 0, 0, 0 } ++ "multi", .nb = 0 },
-        .{ .input = "part" ++ .{ 8, 0, 0, 0 } ++ "co", .nb = 1 },
-        .{ .input = "mbined", .nb = 1 },
-        // several multipart
-        .{ .input = .{ 23, 0, 0, 0 } ++ "multi", .nb = 0 },
-        .{ .input = "several", .nb = 0 },
-        .{ .input = "complex", .nb = 0 },
-        .{ .input = "part", .nb = 1 },
-        // combined & multipart
-        .{ .input = .{ 2, 0, 0, 0 } ++ "ok" ++ .{ 9, 0, 0, 0 } ++ "multi", .nb = 1 },
-        .{ .input = "part", .nb = 1 },
-    };
-
-    var b: [MaxSize]u8 = undefined;
-    var buf = Buffer{ .buf = &b };
-
-    for (cases) |case| {
-        var nb: u8 = 0;
-        var input = case.input;
-        while (input.len > 0) {
-            const parts = buf.read(input) catch |err| {
-                if (err == error.MsgMultipart) break; // go to the next case input
-                return err;
-            };
-            nb += 1;
-            input = parts.left;
-        }
-        try std.testing.expect(nb == case.nb);
-    }
-}
diff --git a/src/server.zig b/src/server.zig
index eb7c0a18..9fbb26a4 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -19,7 +19,10 @@
 const std = @import("std");
 const builtin = @import("builtin");
 
-const Stream = @import("handler.zig").Stream;
+const net = std.net;
+const posix = std.posix;
+
+const Allocator = std.mem.Allocator;
 
 const jsruntime = @import("jsruntime");
 const Completion = jsruntime.IO.Completion;
@@ -30,241 +33,233 @@ const CloseError = jsruntime.IO.CloseError;
 const CancelError = jsruntime.IO.CancelOneError;
 const TimeoutError = jsruntime.IO.TimeoutError;
 
-const MsgBuffer = @import("msg.zig").Buffer;
-const MaxSize = @import("msg.zig").MaxSize;
 const Browser = @import("browser/browser.zig").Browser;
 const cdp = @import("cdp/cdp.zig");
 
-const NoError = error{NoError};
 const IOError = AcceptError || RecvError || SendError || CloseError || TimeoutError || CancelError;
-const Error = IOError || std.fmt.ParseIntError || cdp.Error || NoError;
+const HTTPError = error{
+    OutOfMemory,
+    RequestTooLarge,
+    NotFound,
+    InvalidRequest,
+    MissingHeaders,
+    InvalidProtocol,
+    InvalidUpgradeHeader,
+    InvalidVersionHeader,
+    InvalidConnectionHeader,
+};
+const WebSocketError = error{
+    OutOfMemory,
+    ReservedFlags,
+    NotMasked,
+    TooLarge,
+    InvalidMessageType,
+    ContinuationNotSupported,
+};
+const Error = IOError || cdp.Error || HTTPError || WebSocketError;
 
 const TimeoutCheck = std.time.ns_per_ms * 100;
 
 const log = std.log.scoped(.server);
-const isLinux = builtin.target.os.tag == .linux;
 
-// I/O Main
-// --------
+const MAX_HTTP_REQUEST_SIZE = 2048;
 
-const BufReadSize = 1024; // 1KB
-const MaxStdOutSize = 512; // ensure debug msg are not too long
+// max message size, +14 for max websocket payload overhead
+const MAX_MESSAGE_SIZE = 256 * 1024 + 14;
 
-pub const Ctx = struct {
+// For now, cdp does @import("server.zig").Ctx. Could change cdp to use "Server"
+// but I rather try to decouple the CDP code from the server, so a quick
+// stopgap is fine. TODO: Decouple cdp from the server
+pub const Ctx = Server;
+
+const Server = struct {
+    allocator: Allocator,
     loop: *jsruntime.Loop,
-    stream: ?*Stream,
 
     // internal fields
-    accept_socket: std.posix.socket_t,
-    conn_socket: std.posix.socket_t = undefined,
-    read_buf: []u8, // only for read operations
-    msg_buf: *MsgBuffer,
-    err: ?Error = null,
+    listener: posix.socket_t,
+    client: ?Client(*Server) = null,
+    timeout: u64,
+
+    // a memory poor for our Send objects
+    send_pool: std.heap.MemoryPool(Send),
 
     // I/O fields
-    accept_completion: *Completion,
-    conn_completion: *Completion,
-    timeout_completion: *Completion,
-    timeout: u64,
-    last_active: ?std.time.Instant = null,
+    conn_completion: Completion,
+    close_completion: Completion,
+    accept_completion: Completion,
+    timeout_completion: Completion,
+
+    // used when gluing the session id to the inspector message
+    scrap: std.ArrayListUnmanaged(u8) = .{},
+
+    // The response to send on a GET /json/version request
+    json_version_response: []const u8,
 
     // CDP
     state: cdp.State = undefined,
 
     // JS fields
     browser: *Browser, // TODO: is pointer mandatory here?
-    sessionNew: bool,
-    // try_catch: jsruntime.TryCatch, // TODO
 
     pub fn deinit(self: *Ctx) void {
         self.state.deinit();
+        self.send_pool.deinit();
+        self.allocator.free(self.json_version_response);
     }
 
-    // callbacks
-    // ---------
-
-    fn acceptCbk(
-        self: *Ctx,
-        completion: *Completion,
-        result: AcceptError!std.posix.socket_t,
-    ) void {
-        std.debug.assert(completion == self.acceptCompletion());
-
-        self.conn_socket = result catch |err| {
-            log.err("accept error: {any}", .{err});
-            self.err = err;
-            return;
-        };
-        log.info("client connected", .{});
-
-        // set connection timestamp and timeout
-        self.last_active = std.time.Instant.now() catch |err| {
-            log.err("accept timestamp error: {any}", .{err});
-            return;
-        };
-        self.loop.io.timeout(
-            *Ctx,
+    fn queueAccept(self: *Server) void {
+        log.info("accepting new conn...", .{});
+        self.loop.io.accept(
+            *Server,
             self,
-            Ctx.timeoutCbk,
-            self.timeout_completion,
+            callbackAccept,
+            &self.accept_completion,
+            self.listener,
+        );
+    }
+
+    fn callbackAccept(
+        self: *Server,
+        completion: *Completion,
+        result: AcceptError!posix.socket_t,
+    ) void {
+        std.debug.assert(completion == &self.accept_completion);
+
+        const socket = result catch |err| {
+            log.err("accept error: {any}", .{err});
+            self.queueAccept();
+            return;
+        };
+
+        self.newSession() catch |err| {
+            log.err("new session error: {any}", .{err});
+            self.queueClose(socket);
+            return;
+        };
+
+        log.info("client connected", .{});
+        self.client = Client(*Server).init(socket, self);
+        self.queueRead();
+        self.queueTimeout();
+    }
+
+    fn queueTimeout(self: *Server) void {
+        self.loop.io.timeout(
+            *Server,
+            self,
+            callbackTimeout,
+            &self.timeout_completion,
             TimeoutCheck,
         );
-
-        // receving incomming messages asynchronously
-        self.loop.io.recv(
-            *Ctx,
-            self,
-            Ctx.readCbk,
-            self.conn_completion,
-            self.conn_socket,
-            self.read_buf,
-        );
     }
 
-    fn readCbk(self: *Ctx, completion: *Completion, result: RecvError!usize) void {
-        std.debug.assert(completion == self.conn_completion);
+    fn callbackTimeout(
+        self: *Server,
+        completion: *Completion,
+        result: TimeoutError!void,
+    ) void {
+        std.debug.assert(completion == &self.timeout_completion);
 
-        const size = result catch |err| {
-            if (self.isClosed() and err == error.FileDescriptorInvalid) {
-                log.debug("read has been canceled", .{});
+        const client = &(self.client orelse return);
+
+        if (result) |_| {
+            if (now().since(client.last_active) > self.timeout) {
+                // close current connection
+                log.debug("conn timeout, closing...", .{});
+                client.close(.timeout);
                 return;
             }
-            log.err("read error: {any}", .{err});
-            self.err = err;
-            return;
-        };
-
-        if (size == 0) {
-            // continue receving incomming messages asynchronously
-            self.loop.io.recv(
-                *Ctx,
-                self,
-                Ctx.readCbk,
-                self.conn_completion,
-                self.conn_socket,
-                self.read_buf,
-            );
-            return;
-        }
-
-        // set connection timestamp
-        self.last_active = std.time.Instant.now() catch |err| {
-            log.err("read timestamp error: {any}", .{err});
-            return;
-        };
-
-        // continue receving incomming messages asynchronously
-        self.loop.io.recv(
-            *Ctx,
-            self,
-            Ctx.readCbk,
-            self.conn_completion,
-            self.conn_socket,
-            self.read_buf,
-        );
-
-        // read and execute input
-        var input: []const u8 = self.read_buf[0..size];
-        while (input.len > 0) {
-            const parts = self.msg_buf.read(input) catch |err| {
-                if (err == error.MsgMultipart) {
-                    return;
-                } else {
-                    log.err("msg read error: {any}", .{err});
-                    return;
-                }
-            };
-            input = parts.left;
-            // execute
-            self.do(parts.msg) catch |err| {
-                if (err != error.Closed) {
-                    log.err("do error: {any}", .{err});
-                    log.debug("last msg: {s}", .{parts.msg});
-                }
-            };
-        }
-    }
-
-    fn timeoutCbk(self: *Ctx, completion: *Completion, result: TimeoutError!void) void {
-        std.debug.assert(completion == self.timeout_completion);
-
-        _ = result catch |err| {
+        } else |err| {
             log.err("timeout error: {any}", .{err});
-            self.err = err;
+        }
+
+        // We re-queue this if the timeout hasn't been exceeded or on some
+        // very unlikely IO timeout error.
+        // AKA: we don't requeue this if the connection timed out and we
+        // closed the connection.s
+        self.queueTimeout();
+    }
+
+    fn queueRead(self: *Server) void {
+        if (self.client) |*client| {
+            self.loop.io.recv(
+                *Server,
+                self,
+                callbackRead,
+                &self.conn_completion,
+                client.socket,
+                client.readBuf(),
+            );
+        }
+    }
+
+    fn callbackRead(
+        self: *Server,
+        completion: *Completion,
+        result: RecvError!usize,
+    ) void {
+        std.debug.assert(completion == &self.conn_completion);
+
+        var client = &(self.client orelse return);
+
+        const size = result catch |err| {
+            log.err("read error: {any}", .{err});
+            self.queueClose(client.socket);
             return;
         };
 
-        if (self.isClosed()) {
-            // conn is already closed, ignore timeout
-            return;
-        }
-
-        // check time since last read
-        const now = std.time.Instant.now() catch |err| {
-            log.err("timeout timestamp error: {any}", .{err});
+        const more = client.processData(size) catch |err| {
+            std.debug.print("Client Processing Error: {}\n", .{err});
             return;
         };
 
-        if (now.since(self.last_active.?) > self.timeout) {
-            // close current connection
-            log.debug("conn timeout, closing...", .{});
-            self.close();
-            return;
+        // if more == false, the client is disconnecting
+        if (more) {
+            self.queueRead();
         }
+    }
 
-        // continue checking timeout
-        self.loop.io.timeout(
-            *Ctx,
+    fn queueSend(
+        self: *Server,
+        socket: posix.socket_t,
+        data: []const u8,
+        free_when_done: bool,
+    ) !void {
+        const sd = try self.send_pool.create();
+        errdefer self.send_pool.destroy(sd);
+
+        sd.* = .{
+            .data = data,
+            .unsent = data,
+            .server = self,
+            .socket = socket,
+            .completion = undefined,
+            .free_when_done = free_when_done,
+        };
+        sd.queueSend();
+    }
+
+    fn queueClose(self: *Server, socket: posix.socket_t) void {
+        self.loop.io.close(
+            *Server,
             self,
-            Ctx.timeoutCbk,
-            self.timeout_completion,
-            TimeoutCheck,
+            callbackClose,
+            &self.close_completion,
+            socket,
         );
     }
 
-    // shortcuts
-    // ---------
-
-    inline fn isClosed(self: *Ctx) bool {
-        // last_active is first saved on acceptCbk
-        return self.last_active == null;
-    }
-
-    // allocator of the current session
-    inline fn alloc(self: *Ctx) std.mem.Allocator {
-        return self.browser.session.alloc;
-    }
-
-    // JS env of the current session
-    inline fn env(self: Ctx) jsruntime.Env {
-        return self.browser.session.env;
-    }
-
-    inline fn acceptCompletion(self: *Ctx) *Completion {
-        // NOTE: the logical completion to use here is the accept_completion
-        // as the pipe_connection can be used simulteanously by a recv I/O operation.
-        // But on MacOS (kqueue) the recv I/O operation on a closed socket leads to a panic
-        // so we use the pipe_connection to avoid this problem
-        if (isLinux) return self.accept_completion;
-        return self.conn_completion;
-    }
-
-    // actions
-    // -------
-
-    fn do(self: *Ctx, cmd: []const u8) anyerror!void {
-
-        // close cmd
-        if (std.mem.eql(u8, cmd, "close")) {
-            // close connection
-            log.info("close cmd, closing conn...", .{});
-            self.close();
-            return error.Closed;
+    fn callbackClose(self: *Server, completion: *Completion, _: CloseError!void) void {
+        std.debug.assert(completion == &self.close_completion);
+        if (self.client != null)  {
+            self.client = null;
         }
+        self.queueAccept();
+    }
 
-        if (self.sessionNew) self.sessionNew = false;
-
-        const res = cdp.do(self.alloc(), cmd, self) catch |err| {
+    fn handleCDP(self: *Server, cmd: []const u8) !void {
+        const res = cdp.do(self.allocator, cmd, self) catch |err| {
 
             // cdp end cmd
             if (err == error.DisposeBrowserContext) {
@@ -278,106 +273,106 @@ pub const Ctx = struct {
         };
 
         // send result
-        if (!std.mem.eql(u8, res, "")) {
+        if (res.len != 0) {
             return self.send(res);
         }
     }
 
-    pub fn send(self: *Ctx, msg: []const u8) !void {
-        if (self.stream) |stream| {
-            // if we have a stream connection, just write on it
-            defer self.alloc().free(msg);
-            try stream.send(msg);
-        } else {
-            // otherwise write asynchronously on the socket connection
-            return sendAsync(self, msg);
+    // called from CDP
+    pub fn send(self: *Server, data: []const u8) !void {
+        if (self.client) |*client| {
+            try client.sendWS(data);
         }
     }
 
-    fn close(self: *Ctx) void {
-
-        // conn is closed
-        self.last_active = null;
-        std.posix.close(self.conn_socket);
-        log.debug("connection closed", .{});
-
-        // restart a new browser session in case of re-connect
-        if (!self.sessionNew) {
-            self.newSession() catch |err| {
-                log.err("new session error: {any}", .{err});
-                return;
-            };
-        }
-
-        log.info("accepting new conn...", .{});
-
-        // continue accepting incoming requests
-        self.loop.io.accept(
-            *Ctx,
-            self,
-            Ctx.acceptCbk,
-            self.acceptCompletion(),
-            self.accept_socket,
-        );
-    }
-
-    fn newSession(self: *Ctx) !void {
-        try self.browser.newSession(self.alloc(), self.loop);
+    fn newSession(self: *Server) !void {
+        try self.browser.newSession(self.allocator, self.loop);
         try self.browser.session.initInspector(
             self,
-            Ctx.onInspectorResp,
-            Ctx.onInspectorNotif,
+            inspectorResponse,
+            inspectorEvent,
         );
-        self.sessionNew = true;
     }
 
-    // inspector
-    // ---------
+    // // inspector
+    // // ---------
 
-    pub fn sendInspector(self: *Ctx, msg: []const u8) void {
-        if (self.env().getInspector()) |inspector| {
-            inspector.send(self.env(), msg);
-        } else @panic("Inspector has not been set");
+    // called by cdp
+    pub fn sendInspector(self: *Server, msg: []const u8) !void {
+        const env = self.browser.session.env;
+        if (env.getInspector()) |inspector| {
+            inspector.send(env, msg);
+            return;
+        }
+        return error.InspectNotSet;
     }
 
-    inline fn inspectorCtx(ctx_opaque: *anyopaque) *Ctx {
-        const aligned = @as(*align(@alignOf(Ctx)) anyopaque, @alignCast(ctx_opaque));
-        return @as(*Ctx, @ptrCast(aligned));
-    }
-
-    fn inspectorMsg(allocator: std.mem.Allocator, ctx: *Ctx, msg: []const u8) !void {
-        // inject sessionID in cdp msg
-        const tpl = "{s},\"sessionId\":\"{s}\"}}";
-        const msg_open = msg[0 .. msg.len - 1]; // remove closing bracket
-        const s = try std.fmt.allocPrint(
-            allocator,
-            tpl,
-            .{ msg_open, @tagName(ctx.state.sessionID) },
-        );
-
-        try ctx.send(s);
-    }
-
-    pub fn onInspectorResp(ctx_opaque: *anyopaque, _: u32, msg: []const u8) void {
+    fn inspectorResponse(ctx: *anyopaque, _: u32, msg: []const u8) void {
         if (std.log.defaultLogEnabled(.debug)) {
             // msg should be {"id":<id>,...
-            const id_end = std.mem.indexOfScalar(u8, msg, ',') orelse unreachable;
+            std.debug.assert(std.mem.startsWith(u8, msg, "{\"id\":"));
+
+            const id_end = std.mem.indexOfScalar(u8, msg, ',') orelse {
+                log.warn("invalid inspector response message: {s}", .{msg});
+                return;
+            };
+
             const id = msg[6..id_end];
             std.log.scoped(.cdp).debug("Res (inspector) > id {s}", .{id});
         }
-        const ctx = inspectorCtx(ctx_opaque);
-        inspectorMsg(ctx.alloc(), ctx, msg) catch unreachable;
+        sendInspectorMessage(@alignCast(@ptrCast(ctx)), msg);
     }
 
-    pub fn onInspectorNotif(ctx_opaque: *anyopaque, msg: []const u8) void {
+    fn inspectorEvent(ctx: *anyopaque, msg: []const u8) void {
         if (std.log.defaultLogEnabled(.debug)) {
             // msg should be {"method":<method>,...
-            const method_end = std.mem.indexOfScalar(u8, msg, ',') orelse unreachable;
+            std.debug.assert(std.mem.startsWith(u8, msg, "{\"method\":"));
+            const method_end = std.mem.indexOfScalar(u8, msg, ',') orelse {
+                log.warn("invalid inspector event message: {s}", .{msg});
+                return;
+            };
             const method = msg[10..method_end];
             std.log.scoped(.cdp).debug("Event (inspector) > method {s}", .{method});
         }
-        const ctx = inspectorCtx(ctx_opaque);
-        inspectorMsg(ctx.alloc(), ctx, msg) catch unreachable;
+
+        sendInspectorMessage(@alignCast(@ptrCast(ctx)), msg);
+    }
+
+    fn sendInspectorMessage(self: *Server, msg: []const u8) void {
+        var client = &(self.client orelse return);
+
+        var scrap = &self.scrap;
+        scrap.clearRetainingCapacity();
+
+        const field = ",\"sessionId\":";
+        const sessionID = @tagName(self.state.sessionID);
+
+        // + 2 for the quotes around the session
+        const message_len = msg.len + sessionID.len + 2 + field.len;
+
+        scrap.ensureTotalCapacity(self.allocator, message_len) catch |err| {
+            log.err("Failed to expand inspector buffer: {}", .{err});
+            return;
+        };
+
+        // -1  because we dont' want the closing brace '}'
+        scrap.appendSliceAssumeCapacity(msg[0 .. msg.len - 1]);
+        scrap.appendSliceAssumeCapacity(field);
+        scrap.appendAssumeCapacity('"');
+        scrap.appendSliceAssumeCapacity(sessionID);
+        scrap.appendSliceAssumeCapacity("\"}");
+        std.debug.assert(scrap.items.len == message_len);
+
+        // TODO: Remove when we clean up ownership of messages between
+        // CDD and sending.
+        const owned = self.allocator.dupe(u8, scrap.items) catch return;
+
+        client.sendWS(owned) catch |err| {
+            log.debug("Failed to write inspector message to client: {}", .{err});
+            // don't bother trying to cleanly close the client, if sendWS fails
+            // we're almost certainly in a non-recoverable state (i.e. OOM)
+            self.queueClose(client.socket);
+        };
     }
 };
 
@@ -387,47 +382,568 @@ pub const Ctx = struct {
 // NOTE: to allow concurrent send we create each time a dedicated context
 // (with its own completion), allocated on the heap.
 // After the send (on the sendCbk) the dedicated context will be destroy
-// and the msg slice will be free.
+// and the data slice will be free.
 const Send = struct {
-    ctx: *Ctx,
-    msg: []const u8,
-    completion: Completion = undefined,
+    // The full data to be sent
+    data: []const u8,
 
-    fn init(ctx: *Ctx, msg: []const u8) !*Send {
-        const sd = try ctx.alloc().create(Send);
-        sd.* = .{ .ctx = ctx, .msg = msg };
-        return sd;
-    }
+    // Whether or not to free the data once the message is sent (or fails to)
+    // send. This is false in cases where the message is comptime known
+    free_when_done: bool,
+
+    // Any unsent data we have. Initially unsent == data, but as part of the
+    // message is succesfully sent, unsent becomes a smaller and smaller slice
+    // of data
+    unsent: []const u8,
+
+    server: *Server,
+    completion: Completion,
+    socket: posix.socket_t,
 
     fn deinit(self: *Send) void {
-        self.ctx.alloc().free(self.msg);
-        self.ctx.alloc().destroy(self);
+        var server = self.server;
+        if (self.free_when_done) {
+            server.allocator.free(self.data);
+        }
+        server.send_pool.destroy(self);
     }
 
-    fn asyncCbk(self: *Send, _: *Completion, result: SendError!usize) void {
-        _ = result catch |err| {
+    fn queueSend(self: *Send) void {
+        self.server.loop.io.send(
+            *Send,
+            self,
+            sendCallback,
+            &self.completion,
+            self.socket,
+            self.unsent,
+        );
+    }
+
+    fn sendCallback(
+        self: *Send,
+        _: *Completion,
+        result: SendError!usize,
+    ) void {
+        const sent = result catch |err| {
             log.err("send error: {any}", .{err});
-            self.ctx.err = err;
+            if (self.server.client) |*client| {
+                self.server.queueClose(client.socket);
+            }
+            self.deinit();
+            return;
         };
-        self.deinit();
+
+        if (sent == self.unsent.len) {
+            self.deinit();
+            return;
+        }
+
+        // partial send, re-queue a send for whatever we have left
+        self.unsent = self.unsent[sent..];
+        self.queueSend();
     }
 };
 
-pub fn sendAsync(ctx: *Ctx, msg: []const u8) !void {
-    const sd = try Send.init(ctx, msg);
-    ctx.loop.io.send(*Send, sd, Send.asyncCbk, &sd.completion, ctx.conn_socket, sd.msg);
+// Client
+// --------
+
+// This is a generic only so that it can be unit tested. Normally, S == Server
+// and when we send a message, we'll use server.send(...) to send via the server's
+// IO loop. During tests, we can inject a simple mock to record (and then verify)
+// the send message
+fn Client(comptime S: type) type {
+    const EMPTY_PONG = [_]u8{ 138, 0 };
+
+    // CLOSE, 2 length, code
+    const CLOSE_NORMAL = [_]u8{ 136, 2, 3, 232 }; // code: 1000
+    const CLOSE_TOO_BIG = [_]u8{ 136, 2, 3, 241 }; // 1009
+    const CLOSE_PROTOCOL_ERROR = [_]u8{ 136, 2, 3, 234 }; //code: 1002
+    // This should be removed once we support continuation frames
+    const CLOSE_UNSUPPORTED_ERROR = [_]u8{ 136, 2, 3, 235 }; //code: 1003
+    const CLOSE_TIMEOUT = [_]u8{ 136, 2, 15, 160 }; // code: 4000
+
+    return struct {
+        // The client is initially serving HTTP requests but, under normal circumstances
+        // should eventually be upgraded to a websocket connections
+        mode: Mode,
+        server: S,
+        socket: posix.socket_t,
+        last_active: std.time.Instant,
+
+        // the start of the message in our read_buf
+        read_pos: usize = 0,
+        // up to where do we have data in our read_buf
+        read_len: usize = 0,
+        read_buf: [MAX_MESSAGE_SIZE]u8 = undefined,
+
+        const Mode = enum {
+            http,
+            websocket,
+        };
+
+        const Self = @This();
+
+        fn init(socket: posix.socket_t, server: S) Self {
+            return .{
+                .mode = .http,
+                .socket = socket,
+                .server = server,
+                .last_active = now(),
+            };
+        }
+
+        fn close(self: *Self, close_code: CloseCode) void {
+            if (self.mode == .websocket) {
+                switch (close_code) {
+                    .timeout => self.send(&CLOSE_TIMEOUT, false) catch {},
+                }
+            }
+            self.server.queueClose(self.socket);
+        }
+
+        fn readBuf(self: *Self) []u8 {
+            // We might have read a partial http or websocket message.
+            // Subsequent reads must read from where we left off.
+            std.debug.assert(self.read_pos < self.read_buf.len);
+            return self.read_buf[self.read_len..];
+        }
+
+        fn processData(self: *Self, len: usize) !bool {
+            const end = self.read_len + len;
+            std.debug.assert(end >= self.read_pos);
+
+            self.last_active = now();
+            const data = self.read_buf[self.read_pos..end];
+
+            switch (self.mode) {
+                .http => {
+                    try self.processHTTPRequest(data);
+                    return true;
+                },
+                .websocket => return self.processWebsocketMessage(data),
+            }
+        }
+
+        fn processHTTPRequest(self: *Self, request: []u8) HTTPError!void {
+            // We should never get pipelined HTTP requests
+            std.debug.assert(self.read_pos == 0);
+
+            errdefer self.server.queueClose(self.socket);
+
+            // we're only expecting [body-less] GET requests.
+            if (std.mem.endsWith(u8, request, "\r\n\r\n") == false) {
+                if (request.len > MAX_HTTP_REQUEST_SIZE) {
+                    self.writeHTTPErrorResponse(413, "Request too large");
+                    return error.RequestTooLarge;
+                }
+                // we need more data, put any more data here
+                self.read_len = request.len;
+                return;
+            }
+
+            self.handleHTTPRequest(request) catch |err| {
+                switch (err) {
+                    error.NotFound => self.writeHTTPErrorResponse(404, "Not found"),
+                    error.InvalidRequest => self.writeHTTPErrorResponse(400, "Invalid request"),
+                    error.InvalidProtocol => self.writeHTTPErrorResponse(400, "Invalid HTTP protocol"),
+                    error.MissingHeaders => self.writeHTTPErrorResponse(400, "Missing required header"),
+                    error.InvalidUpgradeHeader => self.writeHTTPErrorResponse(400, "Unsupported upgrade type"),
+                    error.InvalidVersionHeader => self.writeHTTPErrorResponse(400, "Invalid websocket version"),
+                    error.InvalidConnectionHeader => self.writeHTTPErrorResponse(400, "Invalid connection header"),
+                    else => {
+                        log.err("error processing HTTP request: {}", .{err});
+                        self.writeHTTPErrorResponse(500, "Internal Server Error");
+                    },
+                }
+                return err;
+            };
+
+            // the next incoming data can go to the front of our buffer
+            self.read_len = 0;
+        }
+
+        fn handleHTTPRequest(self: *Self, request: []u8) !void {
+            if (request.len < 18) {
+                // 18 is [generously] the smallest acceptable HTTP request
+                return error.InvalidRequest;
+            }
+
+            if (std.mem.eql(u8, request[0..4], "GET ") == false) {
+                return error.NotFound;
+            }
+
+            const url_end = std.mem.indexOfScalarPos(u8, request, 4, ' ') orelse {
+                return error.InvalidRequest;
+            };
+
+            const url = request[4..url_end];
+
+            if (std.mem.eql(u8, url, "/")) {
+                return self.upgradeConnection(request);
+            }
+
+            if (std.mem.eql(u8, url, "/json/version")) {
+                return self.send(self.server.json_version_response, false);
+            }
+
+            return error.NotFound;
+        }
+
+        fn upgradeConnection(self: *Self, request: []u8) !void {
+            // our caller already confirmed that we have a trailing \r\n\r\n
+            const request_line_end = std.mem.indexOfScalar(u8, request, '\r') orelse unreachable;
+            const request_line = request[0..request_line_end];
+
+            if (!std.ascii.endsWithIgnoreCase(request_line, "http/1.1")) {
+                return error.InvalidProtocol;
+            }
+
+            // we need to extract the sec-websocket-key value
+            var key: []const u8 = "";
+
+            // we need to make sure that we got all the necessary headers + values
+            var required_headers: u8 = 0;
+
+            // can't std.mem.split because it forces the iterated value to be const
+            // (we could @constCast...)
+
+            var buf = request[request_line_end + 2 ..];
+
+            while (buf.len > 4) {
+                const index = std.mem.indexOfScalar(u8, buf, '\r') orelse unreachable;
+                const separator = std.mem.indexOfScalar(u8, buf[0..index], ':') orelse return error.InvalidRequest;
+
+                const name = std.mem.trim(u8, toLower(buf[0..separator]), &std.ascii.whitespace);
+                const value = std.mem.trim(u8, buf[(separator + 1)..index], &std.ascii.whitespace);
+
+                if (std.mem.eql(u8, name, "upgrade")) {
+                    if (!std.ascii.eqlIgnoreCase("websocket", value)) {
+                        return error.InvalidUpgradeHeader;
+                    }
+                    required_headers |= 1;
+                } else if (std.mem.eql(u8, name, "sec-websocket-version")) {
+                    if (value.len != 2 or value[0] != '1' or value[1] != '3') {
+                        return error.InvalidVersionHeader;
+                    }
+                    required_headers |= 2;
+                } else if (std.mem.eql(u8, name, "connection")) {
+                    // find if connection header has upgrade in it, example header:
+                    // Connection: keep-alive, Upgrade
+                    if (std.ascii.indexOfIgnoreCase(value, "upgrade") == null) {
+                        return error.InvalidConnectionHeader;
+                    }
+                    required_headers |= 4;
+                } else if (std.mem.eql(u8, name, "sec-websocket-key")) {
+                    key = value;
+                    required_headers |= 8;
+                }
+
+                const next = index + 2;
+                buf = buf[next..];
+            }
+
+            if (required_headers != 15) {
+                return error.MissingHeaders;
+            }
+
+            // our caller has already made sure this request ended in \r\n\r\n
+            // so it isn't something we need to check again
+
+            const response = blk: {
+                // Response to an ugprade request is always this, with
+                // the Sec-Websocket-Accept value a spacial sha1 hash of the
+                // request "sec-websocket-version" and a magic value.
+
+                const template =
+                    "HTTP/1.1 101 Switching Protocols\r\n" ++
+                    "Upgrade: websocket\r\n" ++
+                    "Connection: upgrade\r\n" ++
+                    "Sec-Websocket-Accept: 0000000000000000000000000000\r\n\r\n";
+
+                // The response will be sent via the IO Loop and thus has to have its
+                // own lifetime.
+                const res = try self.server.allocator.dupe(u8, template);
+                errdefer self.server.allocator.free(res);
+
+                // magic response
+                const key_pos = res.len - 32;
+                var h: [20]u8 = undefined;
+                var hasher = std.crypto.hash.Sha1.init(.{});
+                hasher.update(key);
+                // websocket spec always used this value
+                hasher.update("258EAFA5-E914-47DA-95CA-C5AB0DC85B11");
+                hasher.final(&h);
+
+                _ = std.base64.standard.Encoder.encode(res[key_pos .. key_pos + 28], h[0..]);
+
+                break :blk res;
+            };
+
+            self.mode = .websocket;
+            return self.send(response, true);
+        }
+
+        fn processWebsocketMessage(self: *Self, data: []u8) !bool {
+            errdefer self.server.queueClose(self.socket);
+
+            var reader = Reader{ .data = data };
+            while (true) {
+                const msg = reader.next() catch |err| {
+                    switch (err) {
+                        error.TooLarge => self.send(&CLOSE_TOO_BIG, false) catch {},
+                        error.NotMasked => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
+                        error.ReservedFlags => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
+                        error.InvalidMessageType => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
+                        error.ContinuationNotSupported => self.send(&CLOSE_UNSUPPORTED_ERROR, false) catch {},
+                    }
+                    return err;
+                } orelse break;
+
+                switch (msg.type) {
+                    .pong => {},
+                    .ping => try self.sendPong(msg.data),
+                    .close => {
+                        self.send(&CLOSE_NORMAL, false) catch {};
+                        self.server.queueClose(self.socket);
+                        return false;
+                    },
+                    .text, .binary => try self.server.handleCDP(msg.data),
+                }
+            }
+
+            const incomplete = reader.data;
+            self.read_len = incomplete.len;
+            if (incomplete.len > 0) {
+                // we have part of the data for the next message
+
+                // can't use @memset because incomplete is a slice of read_buf,
+                // so they could overlap
+
+                // TODO: this can be skipped if we know that the next message will
+                // fit into whatever reamining space we have.
+                std.mem.copyForwards(u8, self.read_buf[0..incomplete.len], incomplete);
+            }
+            return true;
+        }
+
+        fn sendPong(self: *Self, data: []const u8) !void {
+            if (data.len == 0) {
+                return self.send(&EMPTY_PONG, false);
+            }
+
+            return self.sendFrame(data, .pong);
+        }
+
+        fn sendWS(self: *Self, data: []const u8) !void {
+            std.debug.assert(data.len < 4294967296);
+
+            // for now, we're going to dupe this before we send it, so we don't need
+            // to keep this around.
+            defer self.server.allocator.free(data);
+            return self.sendFrame(data, .text);
+        }
+
+        // We need to append the websocket header to data. If our IO loop supported
+        // a writev call, this would be simple.
+        // For now, we'll just have to dupe data into a larger message.
+        // TODO: Remove this awful allocation (probably by passing a websocket-aware
+        // Writer into CDP)
+        fn sendFrame(self: *Self, data: []const u8, op_code: OpCode) !void {
+            if (comptime builtin.is_test == false) {
+                std.debug.assert(self.mode == .websocket);
+            }
+
+            // 10 is the max possible length of our header
+            // server->client has no mask, so it's 4 fewer bytes than the reader overhead
+            var header_buf: [10]u8 = undefined;
+
+            const header: []const u8 = blk: {
+                const len = data.len;
+                header_buf[0] = 128 | @intFromEnum(op_code); // fin | opcode
+
+                if (len <= 125) {
+                    header_buf[1] = @intCast(len);
+                    break :blk header_buf[0..2];
+                }
+
+                if (len < 65536) {
+                    header_buf[1] = 126;
+                    header_buf[2] = @intCast((len >> 8) & 0xFF);
+                    header_buf[3] = @intCast(len & 0xFF);
+                    break :blk header_buf[0..4];
+                }
+
+                header_buf[1] = 127;
+                header_buf[2] = 0;
+                header_buf[3] = 0;
+                header_buf[4] = 0;
+                header_buf[5] = 0;
+                header_buf[6] = @intCast((len >> 24) & 0xFF);
+                header_buf[7] = @intCast((len >> 16) & 0xFF);
+                header_buf[8] = @intCast((len >> 8) & 0xFF);
+                header_buf[9] = @intCast(len & 0xFF);
+                break :blk header_buf[0..10];
+            };
+
+            const allocator = self.server.allocator;
+            const full = try allocator.alloc(u8, header.len + data.len);
+            errdefer allocator.free(full);
+            @memcpy(full[0..header.len], header);
+            @memcpy(full[header.len..], data);
+            try self.send(full, true);
+        }
+
+        fn writeHTTPErrorResponse(self: *Self, comptime status: u16, comptime body: []const u8) void {
+            const response = std.fmt.comptimePrint(
+                "HTTP/1.1 {d} \r\nConnection: Close\r\nContent-Length: {d}\r\n\r\n{s}",
+                .{ status, body.len, body },
+            );
+
+            // we're going to close this connection anyways, swallowing any
+            // error seems safe
+            self.send(response, false) catch {};
+        }
+
+        fn send(self: *Self, data: []const u8, free_when_done: bool) !void {
+            return self.server.queueSend(self.socket, data, free_when_done);
+        }
+    };
 }
 
-// Listener and handler
-// --------------------
+// WebSocket message reader. Given websocket message, acts as an iterator that
+// can return zero or more Messages. When next returns null, any incomplete
+// message will remain in reader.data
+const Reader = struct {
+    data: []u8,
 
-pub fn handle(
-    alloc: std.mem.Allocator,
-    loop: *jsruntime.Loop,
-    server_socket: std.posix.socket_t,
-    stream: ?*Stream,
+    fn next(self: *Reader) !?Message {
+        var data = self.data;
+        if (data.len < 2) {
+            return null;
+        }
+
+        const byte1 = data[0];
+
+        if (byte1 & 112 != 0) {
+            return error.ReservedFlags;
+        }
+
+        var message_type: Message.Type = undefined;
+        switch (byte1 & 15) {
+            0 => return error.ContinuationNotSupported, // TODO??
+            1 => message_type = .text,
+            2 => message_type = .binary,
+            8 => message_type = .close,
+            9 => message_type = .ping,
+            10 => message_type = .pong,
+            else => return error.InvalidMessageType,
+        }
+
+        if (byte1 & 128 != 128) {
+            // TODO??
+            return error.ContinuationNotSupported;
+        }
+
+        const byte2 = data[1];
+        if (byte2 & 128 != 128) {
+            // client -> server messages _must_ be masked
+            return error.NotMasked;
+        }
+
+        const length_of_len: usize = switch (byte2 & 127) {
+            126 => 2,
+            127 => 8,
+            else => 0,
+        };
+
+        if (data.len < length_of_len + 2) {
+            // we definitely don't have enough data yet
+            return null;
+        }
+
+        const message_len = switch (length_of_len) {
+            2 => @as(u16, @intCast(data[3])) | @as(u16, @intCast(data[2])) << 8,
+            8 => @as(u64, @intCast(data[9])) | @as(u64, @intCast(data[8])) << 8 | @as(u64, @intCast(data[7])) << 16 | @as(u64, @intCast(data[6])) << 24 | @as(u64, @intCast(data[5])) << 32 | @as(u64, @intCast(data[4])) << 40 | @as(u64, @intCast(data[3])) << 48 | @as(u64, @intCast(data[2])) << 56,
+            else => data[1] & 127,
+        } + length_of_len + 2 + 4; // +2 for header prefix, +4 for mask
+
+        if (message_len > MAX_MESSAGE_SIZE) {
+            return error.TooLarge;
+        }
+
+        if (data.len < message_len) {
+            return null;
+        }
+
+        // prefix + length_of_len + mask
+        const header_len = 2 + length_of_len + 4;
+
+        const payload = data[header_len..message_len];
+        mask(data[header_len - 4 .. header_len], payload);
+
+        self.data = data[message_len..];
+        return .{
+            .type = message_type,
+            .data = payload,
+        };
+    }
+};
+
+const Message = struct {
+    type: Type,
+    data: []const u8,
+
+    const Type = enum {
+        text,
+        binary,
+        close,
+        ping,
+        pong,
+    };
+};
+
+// These are the only websocket types that we're currently sending
+const OpCode = enum(u8) {
+    text = 128 | 1,
+    close = 128 | 8,
+    pong = 128 | 10,
+};
+
+// "private-use" close codes must be from 4000-49999
+const CloseCode = enum {
+    timeout,
+};
+
+pub fn run(
+    allocator: Allocator,
+    address: net.Address,
     timeout: u64,
-) anyerror!void {
+    loop: *jsruntime.Loop,
+) !void {
+    if (comptime builtin.is_test) {
+        // There's bunch of code that won't compiler in a test build (because
+        // it relies on a global root.Types). So we fight the compiler and make
+        // sure it doesn't include any of that code. Hopefully one day we can
+        // remove all this.
+        return;
+    }
+
+    // create socket
+    const flags = posix.SOCK.STREAM | posix.SOCK.CLOEXEC | posix.SOCK.NONBLOCK;
+    const listener = try posix.socket(address.any.family, flags, posix.IPPROTO.TCP);
+    defer posix.close(listener);
+
+    try posix.setsockopt(listener, posix.SOL.SOCKET, posix.SO.REUSEADDR, &std.mem.toBytes(@as(c_int, 1)));
+    // TODO: Broken on darwin
+    // https://github.com/ziglang/zig/issues/17260  (fixed in Zig 0.14)
+    // if (@hasDecl(os.TCP, "NODELAY")) {
+    //  try os.setsockopt(socket.sockfd.?, os.IPPROTO.TCP, os.TCP.NODELAY, &std.mem.toBytes(@as(c_int, 1)));
+    // }
+    try posix.setsockopt(listener, posix.IPPROTO.TCP, 1, &std.mem.toBytes(@as(c_int, 1)));
+
+    // bind & listen
+    try posix.bind(listener, &address.any, address.getOsSockLen());
+    try posix.listen(listener, 1);
 
     // create v8 vm
     const vm = jsruntime.VM.init();
@@ -435,46 +951,31 @@ pub fn handle(
 
     // browser
     var browser: Browser = undefined;
-    try Browser.init(&browser, alloc, loop, vm);
+    try Browser.init(&browser, allocator, loop, vm);
     defer browser.deinit();
 
-    // create buffers
-    var read_buf: [BufReadSize]u8 = undefined;
-    var buf: [MaxSize]u8 = undefined;
-    var msg_buf = MsgBuffer{ .buf = &buf };
+    const json_version_response = try buildJSONVersionResponse(allocator, address);
 
-    // create I/O completions
-    var accept_completion: Completion = undefined;
-    var conn_completion: Completion = undefined;
-    var timeout_completion: Completion = undefined;
-
-    // create I/O contexts and callbacks
-    // for accepting connections and receving messages
-    var ctx = Ctx{
+    var server = Server{
         .loop = loop,
-        .stream = stream,
-        .browser = &browser,
-        .sessionNew = true,
-        .read_buf = &read_buf,
-        .msg_buf = &msg_buf,
-        .accept_socket = server_socket,
         .timeout = timeout,
-        .accept_completion = &accept_completion,
-        .conn_completion = &conn_completion,
-        .timeout_completion = &timeout_completion,
+        .browser = &browser,
+        .listener = listener,
+        .allocator = allocator,
+        .conn_completion = undefined,
+        .close_completion = undefined,
+        .accept_completion = undefined,
+        .timeout_completion = undefined,
         .state = cdp.State.init(browser.session.alloc),
+        .json_version_response = json_version_response,
+        .send_pool = std.heap.MemoryPool(Send).init(allocator),
     };
-    defer ctx.deinit();
+    defer server.deinit();
 
-    try browser.session.initInspector(
-        &ctx,
-        Ctx.onInspectorResp,
-        Ctx.onInspectorNotif,
-    );
+    try browser.session.initInspector(&server, Server.inspectorResponse, Server.inspectorEvent);
 
-    // accepting connection asynchronously on internal server
-    log.info("accepting new conn...", .{});
-    loop.io.accept(*Ctx, &ctx, Ctx.acceptCbk, ctx.acceptCompletion(), ctx.accept_socket);
+    // accept an connection
+    server.queueAccept();
 
     // infinite loop on I/O events, either:
     // - cmd from incoming connection on server socket
@@ -483,58 +984,565 @@ pub fn handle(
         try loop.io.run_for_ns(10 * std.time.ns_per_ms);
         if (loop.cbk_error) {
             log.err("JS error", .{});
-            // if (try try_catch.exception(alloc, js_env.*)) |msg| {
-            //     std.debug.print("\n\rUncaught {s}\n\r", .{msg});
-            //     alloc.free(msg);
-            // }
-            // loop.cbk_error = false;
-        }
-        if (ctx.err) |err| {
-            if (err != error.NoError) log.err("Server error: {any}", .{err});
-            break;
         }
     }
 }
 
-fn setSockOpt(fd: std.posix.socket_t, level: i32, option: u32, value: c_int) !void {
-    try std.posix.setsockopt(fd, level, option, &std.mem.toBytes(value));
+// Utils
+// --------
+
+fn buildJSONVersionResponse(
+    allocator: Allocator,
+    address: net.Address,
+) ![]const u8 {
+    const body_format = "{{\"webSocketDebuggerUrl\": \"ws://{}/\"}}";
+    const body_len = std.fmt.count(body_format, .{address});
+
+    const response_format =
+        "HTTP/1.1 200 OK\r\n" ++
+        "Content-Length: {d}\r\n" ++
+        "Content-Type: application/json; charset=UTF-8\r\n\r\n" ++
+        body_format;
+    return try std.fmt.allocPrint(allocator, response_format, .{ body_len, address });
 }
 
-fn isUnixSocket(addr: std.net.Address) bool {
-    return addr.any.family == std.posix.AF.UNIX;
+fn now() std.time.Instant {
+    // can only fail on platforms we don't support
+    return std.time.Instant.now() catch unreachable;
 }
 
-pub fn listen(address: std.net.Address) !std.posix.socket_t {
-    const isunixsock = isUnixSocket(address);
-
-    // create socket
-    const flags = std.posix.SOCK.STREAM | std.posix.SOCK.CLOEXEC | std.posix.SOCK.NONBLOCK;
-    const proto = if (isunixsock) @as(u32, 0) else std.posix.IPPROTO.TCP;
-    const sockfd = try std.posix.socket(address.any.family, flags, proto);
-    errdefer std.posix.close(sockfd);
-
-    // socket options
-    //
-    // REUSEPORT can't be set on unix socket anymore.
-    // see https://github.com/torvalds/linux/commit/5b0af621c3f6ef9261cf6067812f2fd9943acb4b
-    if (@hasDecl(std.posix.SO, "REUSEPORT") and !isunixsock) {
-        try setSockOpt(sockfd, std.posix.SOL.SOCKET, std.posix.SO.REUSEPORT, 1);
+// In-place string lowercase
+fn toLower(str: []u8) []u8 {
+    for (str, 0..) |c, i| {
+        str[i] = std.ascii.toLower(c);
     }
-    try setSockOpt(sockfd, std.posix.SOL.SOCKET, std.posix.SO.REUSEADDR, 1);
-    if (!isUnixSocket(address)) {
-        if (builtin.target.os.tag == .linux) { // posix.TCP not available on MacOS
-            // WARNING: disable Nagle's alogrithm to avoid latency issues
-            try setSockOpt(sockfd, std.posix.IPPROTO.TCP, std.posix.TCP.NODELAY, 1);
+    return str;
+}
+
+// Zig is in a weird backend transition right now. Need to determine if
+// SIMD is even available.
+const backend_supports_vectors = switch (builtin.zig_backend) {
+    .stage2_llvm, .stage2_c => true,
+    else => false,
+};
+
+// Websocket messages from client->server are masked using a 4 byte XOR mask
+fn mask(m: []const u8, payload: []u8) void {
+    var data = payload;
+
+    if (!comptime backend_supports_vectors) return simpleMask(m, data);
+
+    const vector_size = std.simd.suggestVectorLength(u8) orelse @sizeOf(usize);
+    if (data.len >= vector_size) {
+        const mask_vector = std.simd.repeat(vector_size, @as(@Vector(4, u8), m[0..4].*));
+        while (data.len >= vector_size) {
+            const slice = data[0..vector_size];
+            const masked_data_slice: @Vector(vector_size, u8) = slice.*;
+            slice.* = masked_data_slice ^ mask_vector;
+            data = data[vector_size..];
         }
     }
-
-    // bind & listen
-    var socklen = address.getOsSockLen();
-    try std.posix.bind(sockfd, &address.any, socklen);
-    const kernel_backlog = 1; // default value is 128. Here we just want 1 connection
-    try std.posix.listen(sockfd, kernel_backlog);
-    var listen_address: std.net.Address = undefined;
-    try std.posix.getsockname(sockfd, &listen_address.any, &socklen);
-
-    return sockfd;
+    simpleMask(m, data);
 }
+
+// Used when SIMD isn't available, or for any remaining part of the message
+// which is too small to effectively use SIMD.
+fn simpleMask(m: []const u8, payload: []u8) void {
+    for (payload, 0..) |b, i| {
+        payload[i] = b ^ m[i & 3];
+    }
+}
+
+const testing = std.testing;
+test "server: buildJSONVersionResponse" {
+    const address = try net.Address.parseIp4("127.0.0.1", 9001);
+    const res = try buildJSONVersionResponse(testing.allocator, address);
+    defer testing.allocator.free(res);
+
+    try testing.expectEqualStrings("HTTP/1.1 200 OK\r\n" ++
+        "Content-Length: 48\r\n" ++
+        "Content-Type: application/json; charset=UTF-8\r\n\r\n" ++
+        "{\"webSocketDebuggerUrl\": \"ws://127.0.0.1:9001/\"}", res);
+}
+
+test "Client: http invalid handshake" {
+    try assertHTTPError(
+        error.InvalidRequest,
+        400,
+        "Invalid request",
+        "\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.NotFound,
+        404,
+        "Not found",
+        "GET /over/9000 HTTP/1.1\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.NotFound,
+        404,
+        "Not found",
+        "POST / HTTP/1.1\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.InvalidProtocol,
+        400,
+        "Invalid HTTP protocol",
+        "GET / HTTP/1.0\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.MissingHeaders,
+        400,
+        "Missing required header",
+        "GET / HTTP/1.1\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.MissingHeaders,
+        400,
+        "Missing required header",
+        "GET / HTTP/1.1\r\nConnection:  upgrade\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.MissingHeaders,
+        400,
+        "Missing required header",
+        "GET / HTTP/1.1\r\nConnection: upgrade\r\nUpgrade: websocket\r\n\r\n",
+    );
+
+    try assertHTTPError(
+        error.MissingHeaders,
+        400,
+        "Missing required header",
+        "GET / HTTP/1.1\r\nConnection: upgrade\r\nUpgrade: websocket\r\nsec-websocket-version:13\r\n\r\n",
+    );
+}
+
+test "Client: http valid handshake" {
+    var ms = MockServer{};
+    defer ms.deinit();
+
+    var client = Client(*MockServer).init(0, &ms);
+
+    const request =
+        "GET /   HTTP/1.1\r\n" ++
+        "Connection: upgrade\r\n" ++
+        "Upgrade: websocket\r\n" ++
+        "sec-websocket-version:13\r\n" ++
+        "sec-websocket-key: this is my key\r\n" ++
+        "Custom:  Header-Value\r\n\r\n";
+
+    @memcpy(client.read_buf[0..request.len], request);
+    try testing.expectEqual(true, try client.processData(request.len));
+
+    try testing.expectEqual(.websocket, client.mode);
+    try testing.expectEqualStrings(
+        "HTTP/1.1 101 Switching Protocols\r\n" ++
+            "Upgrade: websocket\r\n" ++
+            "Connection: upgrade\r\n" ++
+            "Sec-Websocket-Accept: flzHu2DevQ2dSCSVqKSii5e9C2o=\r\n\r\n",
+        ms.sent.items[0],
+    );
+}
+
+test "Client: http get json version" {
+    var ms = MockServer{};
+    defer ms.deinit();
+
+    var client = Client(*MockServer).init(0, &ms);
+
+    const request = "GET /json/version HTTP/1.1\r\n\r\n";
+
+    @memcpy(client.read_buf[0..request.len], request);
+    try testing.expectEqual(true, try client.processData(request.len));
+
+    try testing.expectEqual(.http, client.mode);
+
+    // this is the hardcoded string in our MockServer
+    try testing.expectEqualStrings("the json version response", ms.sent.items[0]);
+}
+
+test "Client: write websocket message" {
+    const cases = [_]struct { expected: []const u8, message: []const u8 }{
+        .{ .expected = &.{ 129, 0 }, .message = "" },
+        .{ .expected = [_]u8{ 129, 12 } ++ "hello world!", .message = "hello world!" },
+        .{ .expected = [_]u8{ 129, 126, 0, 130 } ++ ("A" ** 130), .message = "A" ** 130 },
+    };
+
+    for (cases) |c| {
+        var ms = MockServer{};
+        defer ms.deinit();
+
+        var client = Client(*MockServer).init(0, &ms);
+
+        try client.sendWS(try testing.allocator.dupe(u8, c.message));
+        try testing.expectEqual(1, ms.sent.items.len);
+        try testing.expectEqualSlices(u8, c.expected, ms.sent.items[0]);
+    }
+}
+
+test "Client: read invalid websocket message" {
+    try assertWebSocketError(
+        error.InvalidMessageType,
+        1002,
+        "",
+        &.{ 131, 1 }, // 128 (fin) | 3  where 3 isn't a valid type
+    );
+
+    try assertWebSocketError(
+        error.ContinuationNotSupported,
+        1003,
+        "",
+        &.{ 128, 1 }, // 128 (fin) | 0  where 0 is a continuation frame
+    );
+
+    try assertWebSocketError(
+        error.ContinuationNotSupported,
+        1003,
+        "",
+        &.{ 1, 1 }, // 0 (non-fin) | 1  non-fin (contination) not supported
+    );
+
+    for ([_]u8{ 16, 32, 64 }) |rsv| {
+        // none of the reserve flags should be set
+        try assertWebSocketError(
+            error.ReservedFlags,
+            1002,
+            "",
+            &.{ rsv, 0 },
+        );
+
+        // as a bitmask
+        try assertWebSocketError(
+            error.ReservedFlags,
+            1002,
+            "",
+            &.{ rsv + 4, 0 },
+        );
+    }
+
+    try assertWebSocketError(
+        error.NotMasked,
+        1002,
+        "",
+        &.{ 129, 127 }, // client->server messages must be masked
+    );
+
+    try assertWebSocketError(
+        error.TooLarge,
+        1009,
+        "",
+        &.{ 129, 255, 0, 0, 0, 0, 0, 4, 0, 1 }, // 1024 * 256 + 1
+    );
+}
+
+test "Client: ping reply" {
+    try assertWebSocketMessage(
+        // fin | pong, len
+        &.{ 138, 0 },
+
+        // fin | ping, masked | len, 4-byte mask
+        &.{ 137, 128, 0, 0, 0, 0 },
+    );
+
+    try assertWebSocketMessage(
+        // fin | pong, len, payload
+        &.{ 138, 5, 100, 96, 97, 109, 104 },
+
+        // fin | ping, masked | len, 4-byte mask, 5 byte payload
+        &.{ 137, 133, 0, 5, 7, 10, 100, 101, 102, 103, 104 },
+    );
+}
+
+test "Client: close message" {
+    try assertWebSocketMessage(
+        // fin | close, len, close code (normal)
+        &.{ 136, 2, 3, 232 },
+
+        // fin | close, masked | len, 4-byte mask
+        &.{ 136, 128, 0, 0, 0, 0 },
+    );
+}
+
+// Testing both HTTP and websocket messages broken up across multiple reads.
+// We need to fuzz HTTP messages differently than websocket. HTTP are strictly
+// req -> res with no pipelining. So there should only be 1 message at a time.
+// So we can only "fuzz" on a per-message basis.
+// But for websocket, we can fuzz _all_ the messages together.
+test "Client: fuzz" {
+    var prng = std.rand.DefaultPrng.init(blk: {
+        var seed: u64 = undefined;
+        try std.posix.getrandom(std.mem.asBytes(&seed));
+        break :blk seed;
+    });
+    const random = prng.random();
+
+    const allocator = testing.allocator;
+    var websocket_messages: std.ArrayListUnmanaged(u8) = .{};
+    defer websocket_messages.deinit(allocator);
+
+    // ping with no payload
+    try websocket_messages.appendSlice(
+        allocator,
+        &.{ 137, 128, 0, 0, 0, 0 },
+    );
+
+    // // 10 byte text message with a 0,0,0,0 mask
+    try websocket_messages.appendSlice(
+        allocator,
+        &.{ 129, 138, 0, 0, 0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 },
+    );
+
+    // ping with a payload
+    try websocket_messages.appendSlice(
+        allocator,
+        &.{ 137, 133, 0, 5, 7, 10, 100, 101, 102, 103, 104 },
+    );
+
+    // pong with no payload (noop in the server)
+    try websocket_messages.appendSlice(
+        allocator,
+        &.{ 138, 128, 10, 10, 10, 10 },
+    );
+
+    // 687 long message, with a mask
+    try websocket_messages.appendSlice(
+        allocator,
+        [_]u8{ 129, 254, 2, 175, 1, 2, 3, 4 } ++ "A" ** 687,
+    );
+
+    // close
+    try websocket_messages.appendSlice(
+        allocator,
+        &.{ 136, 130, 200, 103, 34, 22, 0, 1 },
+    );
+
+    const SendRandom = struct {
+        fn send(c: anytype, r: std.Random, data: []const u8) !void {
+            var buf = data;
+            while (buf.len > 0) {
+                const to_send = r.intRangeAtMost(usize, 1, buf.len);
+                @memcpy(c.readBuf()[0..to_send], buf[0..to_send]);
+                if (try c.processData(to_send) == false) {
+                    return;
+                }
+                buf = buf[to_send..];
+            }
+        }
+    };
+
+    for (0..1) |_| {
+        var ms = MockServer{};
+        defer ms.deinit();
+
+        var client = Client(*MockServer).init(0, &ms);
+
+        try SendRandom.send(&client, random, "GET /json/version HTTP/1.1\r\nContent-Length: 0\r\n\r\n");
+        try SendRandom.send(&client, random, "GET /   HTTP/1.1\r\n" ++
+            "Connection: upgrade\r\n" ++
+            "Upgrade: websocket\r\n" ++
+            "sec-websocket-version:13\r\n" ++
+            "sec-websocket-key: 1234aa93\r\n" ++
+            "Custom:  Header-Value\r\n\r\n");
+
+        // fuzz over all websocket messages
+        try SendRandom.send(&client, random, websocket_messages.items);
+
+        try testing.expectEqual(5, ms.sent.items.len);
+
+        try testing.expectEqualStrings(
+            "the json version response",
+            ms.sent.items[0],
+        );
+
+        try testing.expectEqualStrings(
+            "HTTP/1.1 101 Switching Protocols\r\n" ++
+                "Upgrade: websocket\r\n" ++
+                "Connection: upgrade\r\n" ++
+                "Sec-Websocket-Accept: KnOKWrrjHS0nGFmtfmYFQoPIGKQ=\r\n\r\n",
+            ms.sent.items[1],
+        );
+
+        try testing.expectEqualSlices(u8, &.{ 138, 0 }, ms.sent.items[2]);
+
+        try testing.expectEqualSlices(
+            u8,
+            &.{ 138, 5, 100, 96, 97, 109, 104 },
+            ms.sent.items[3],
+        );
+
+        try testing.expectEqualSlices(
+            u8,
+            &.{ 136, 2, 3, 232 },
+            ms.sent.items[4],
+        );
+
+        try testing.expectEqual(2, ms.cdp.items.len);
+        try testing.expectEqualSlices(
+            u8,
+            &.{ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 },
+            ms.cdp.items[0],
+        );
+
+        try testing.expectEqualSlices(
+            u8,
+            &([_]u8{ 64, 67, 66, 69 } ** 171 ++ [_]u8{ 64, 67, 66 }),
+            ms.cdp.items[1],
+        );
+
+        try testing.expectEqual(true, ms.closed);
+    }
+}
+
+test "server: mask" {
+    var buf: [4000]u8 = undefined;
+    const messages = [_][]const u8{ "1234", "1234" ** 99, "1234" ** 999 };
+    for (messages) |message| {
+        // we need the message to be mutable since mask operates in-place
+        const payload = buf[0..message.len];
+        @memcpy(payload, message);
+
+        mask(&.{ 1, 2, 200, 240 }, payload);
+        try testing.expectEqual(false, std.mem.eql(u8, payload, message));
+
+        mask(&.{ 1, 2, 200, 240 }, payload);
+        try testing.expectEqual(true, std.mem.eql(u8, payload, message));
+    }
+}
+
+fn assertHTTPError(
+    expected_error: HTTPError,
+    comptime expected_status: u16,
+    comptime expected_body: []const u8,
+    input: []const u8,
+) !void {
+    var ms = MockServer{};
+    defer ms.deinit();
+
+    var client = Client(*MockServer).init(0, &ms);
+    @memcpy(client.read_buf[0..input.len], input);
+    try testing.expectError(expected_error, client.processData(input.len));
+
+    const expected_response = std.fmt.comptimePrint(
+        "HTTP/1.1 {d} \r\nConnection: Close\r\nContent-Length: {d}\r\n\r\n{s}",
+        .{ expected_status, expected_body.len, expected_body },
+    );
+
+    try testing.expectEqual(1, ms.sent.items.len);
+    try testing.expectEqualStrings(expected_response, ms.sent.items[0]);
+}
+
+fn assertWebSocketError(
+    expected_error: WebSocketError,
+    close_code: u16,
+    close_payload: []const u8,
+    input: []const u8,
+) !void {
+    var ms = MockServer{};
+    defer ms.deinit();
+
+    var client = Client(*MockServer).init(0, &ms);
+    client.mode = .websocket; // force websocket message processing
+
+    @memcpy(client.read_buf[0..input.len], input);
+    try testing.expectError(expected_error, client.processData(input.len));
+
+    try testing.expectEqual(1, ms.sent.items.len);
+
+    const actual = ms.sent.items[0];
+
+    // fin | close opcode
+    try testing.expectEqual(136, actual[0]);
+
+    // message length (code + payload)
+    try testing.expectEqual(2 + close_payload.len, actual[1]);
+
+    // close code
+    try testing.expectEqual(close_code, std.mem.readInt(u16, actual[2..4], .big));
+
+    // close payload (if any)
+    try testing.expectEqualStrings(close_payload, actual[4..]);
+}
+
+fn assertWebSocketMessage(
+    expected: []const u8,
+    input: []const u8,
+) !void {
+    var ms = MockServer{};
+    defer ms.deinit();
+
+    var client = Client(*MockServer).init(0, &ms);
+    client.mode = .websocket; // force websocket message processing
+
+    @memcpy(client.read_buf[0..input.len], input);
+    const more = try client.processData(input.len);
+
+    try testing.expectEqual(1, ms.sent.items.len);
+    try testing.expectEqualSlices(u8, expected, ms.sent.items[0]);
+
+    // if we sent a close message, then the serve should have been told
+    // to close the connection
+    if (expected[0] == 136) {
+        try testing.expectEqual(true, ms.closed);
+        try testing.expectEqual(false, more);
+    } else {
+        try testing.expectEqual(false, ms.closed);
+        try testing.expectEqual(true, more);
+    }
+}
+
+const MockServer = struct {
+    closed: bool = false,
+
+    // record the messages we sent to the client
+    sent: std.ArrayListUnmanaged([]const u8) = .{},
+
+    // record the CDP messages we need to process
+    cdp: std.ArrayListUnmanaged([]const u8) = .{},
+
+    allocator: Allocator = testing.allocator,
+
+    json_version_response: []const u8 = "the json version response",
+
+    fn deinit(self: *MockServer) void {
+        const allocator = self.allocator;
+
+        for (self.sent.items) |msg| {
+            allocator.free(msg);
+        }
+        self.sent.deinit(allocator);
+
+        for (self.cdp.items) |msg| {
+            allocator.free(msg);
+        }
+        self.cdp.deinit(allocator);
+    }
+
+    fn queueClose(self: *MockServer, _: anytype) void {
+        self.closed = true;
+    }
+
+    fn handleCDP(self: *MockServer, message: []const u8) !void {
+        const owned = try self.allocator.dupe(u8, message);
+        try self.cdp.append(self.allocator, owned);
+    }
+
+    fn queueSend(
+        self: *MockServer,
+        socket: posix.socket_t,
+        data: []const u8,
+        free_when_done: bool,
+    ) !void {
+        _ = socket;
+        const owned = try self.allocator.dupe(u8, data);
+        try self.sent.append(self.allocator, owned);
+        if (free_when_done) {
+            testing.allocator.free(data);
+        }
+    }
+};
diff --git a/src/unit_tests.zig b/src/unit_tests.zig
index 2ab87f9a..7508821e 100644
--- a/src/unit_tests.zig
+++ b/src/unit_tests.zig
@@ -341,7 +341,7 @@ test {
     std.testing.refAllDecls(@import("css/parser.zig"));
     std.testing.refAllDecls(@import("generate.zig"));
     std.testing.refAllDecls(@import("http/Client.zig"));
-    std.testing.refAllDecls(@import("msg.zig"));
     std.testing.refAllDecls(@import("storage/storage.zig"));
     std.testing.refAllDecls(@import("iterator/iterator.zig"));
+    std.testing.refAllDecls(@import("server.zig"));
 }
diff --git a/vendor/zig-js-runtime b/vendor/zig-js-runtime
index 61c71e5e..f40f4914 160000
--- a/vendor/zig-js-runtime
+++ b/vendor/zig-js-runtime
@@ -1 +1 @@
-Subproject commit 61c71e5e390316786a0c780d9135a45890bda846
+Subproject commit f40f4914667f4fc7cd14ee0df0e76a2fd8d835b4

From 92afcd174d14af0bdc5796e22f21dcd48949e2f0 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Thu, 6 Feb 2025 22:29:15 +0800
Subject: [PATCH 03/10] remove websocket.zig dependency from build

---
 vendor/websocket.zig | 1 -
 1 file changed, 1 deletion(-)
 delete mode 160000 vendor/websocket.zig

diff --git a/vendor/websocket.zig b/vendor/websocket.zig
deleted file mode 160000
index 1b49626c..00000000
--- a/vendor/websocket.zig
+++ /dev/null
@@ -1 +0,0 @@
-Subproject commit 1b49626c78bb5063cede4f22b30496fc66e7ba64

From 0753eb7691883dcc3a85252f008232ec895ff925 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Thu, 6 Feb 2025 22:33:54 +0800
Subject: [PATCH 04/10] zig fmt

---
 src/server.zig | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/server.zig b/src/server.zig
index 9fbb26a4..122146d3 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -252,7 +252,7 @@ const Server = struct {
 
     fn callbackClose(self: *Server, completion: *Completion, _: CloseError!void) void {
         std.debug.assert(completion == &self.close_completion);
-        if (self.client != null)  {
+        if (self.client != null) {
             self.client = null;
         }
         self.queueAccept();

From 68e0ffc95cc4a84f5a9341ae09e77923e308ee09 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Fri, 7 Feb 2025 11:46:11 +0800
Subject: [PATCH 05/10] "fix" test compilation

---
 src/main_tests.zig | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/src/main_tests.zig b/src/main_tests.zig
index 88acd1a5..8028827c 100644
--- a/src/main_tests.zig
+++ b/src/main_tests.zig
@@ -337,7 +337,12 @@ test {
 
     std.testing.refAllDecls(@import("generate.zig"));
     std.testing.refAllDecls(@import("cdp/msg.zig"));
-    std.testing.refAllDecls(@import("server.zig"));
+
+    // Don't use refAllDecls, as this will pull in the entire project
+    // and break the test build.
+    // We should fix this. See this branch & the commit message for details:
+    // https://github.com/karlseguin/browser/commit/193ab5ceab3d3758ea06db04f7690460d79eb79e
+    _ = @import("server.zig");
 }
 
 fn testJSRuntime(alloc: std.mem.Allocator) !void {

From f1b275d5d088e6687fac0076c24e6de5e0cf1241 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Fri, 7 Feb 2025 12:33:47 +0800
Subject: [PATCH 06/10] Increase fuzz count. Add test for [too] large HTTP
 requests

---
 src/server.zig | 21 ++++++++++++++++-----
 1 file changed, 16 insertions(+), 5 deletions(-)

diff --git a/src/server.zig b/src/server.zig
index 122146d3..0a2a60b8 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -530,12 +530,13 @@ fn Client(comptime S: type) type {
 
             errdefer self.server.queueClose(self.socket);
 
+            if (request.len > MAX_HTTP_REQUEST_SIZE) {
+                self.writeHTTPErrorResponse(413, "Request too large");
+                return error.RequestTooLarge;
+            }
+
             // we're only expecting [body-less] GET requests.
             if (std.mem.endsWith(u8, request, "\r\n\r\n") == false) {
-                if (request.len > MAX_HTTP_REQUEST_SIZE) {
-                    self.writeHTTPErrorResponse(413, "Request too large");
-                    return error.RequestTooLarge;
-                }
                 // we need more data, put any more data here
                 self.read_len = request.len;
                 return;
@@ -1065,6 +1066,16 @@ test "server: buildJSONVersionResponse" {
         "{\"webSocketDebuggerUrl\": \"ws://127.0.0.1:9001/\"}", res);
 }
 
+test "Client: http invalid request" {
+    try assertHTTPError(
+        error.RequestTooLarge,
+        413,
+        "Request too large",
+        "GET /over/9000 HTTP/1.1\r\n" ++ "Header: " ++ ("a" ** 2050) ++ "\r\n\r\n",
+    );
+
+}
+
 test "Client: http invalid handshake" {
     try assertHTTPError(
         error.InvalidRequest,
@@ -1336,7 +1347,7 @@ test "Client: fuzz" {
         }
     };
 
-    for (0..1) |_| {
+    for (0..100) |_| {
         var ms = MockServer{};
         defer ms.deinit();
 

From 4a11f80c45dab6f9eb5dabc19f11925e9dcd95a0 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Fri, 7 Feb 2025 15:57:02 +0800
Subject: [PATCH 07/10] Make websocket client reader stateful

Move more logic into the reader. Avoid copying partial messages in
cases where we know that the buffer is large enough.

This is mostly groundwork for trying to add support for continuation
frames.
---
 src/server.zig | 236 +++++++++++++++++++++++++++++++------------------
 1 file changed, 149 insertions(+), 87 deletions(-)

diff --git a/src/server.zig b/src/server.zig
index 0a2a60b8..980127c3 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -64,7 +64,9 @@ const log = std.log.scoped(.server);
 
 const MAX_HTTP_REQUEST_SIZE = 2048;
 
-// max message size, +14 for max websocket payload overhead
+// max message size
+// +14 for max websocket payload overhead
+// +140 for the max control packet that might be interleaved in a message
 const MAX_MESSAGE_SIZE = 256 * 1024 + 14;
 
 // For now, cdp does @import("server.zig").Ctx. Could change cdp to use "Server"
@@ -467,15 +469,10 @@ fn Client(comptime S: type) type {
         // should eventually be upgraded to a websocket connections
         mode: Mode,
         server: S,
+        reader: Reader,
         socket: posix.socket_t,
         last_active: std.time.Instant,
 
-        // the start of the message in our read_buf
-        read_pos: usize = 0,
-        // up to where do we have data in our read_buf
-        read_len: usize = 0,
-        read_buf: [MAX_MESSAGE_SIZE]u8 = undefined,
-
         const Mode = enum {
             http,
             websocket,
@@ -486,6 +483,7 @@ fn Client(comptime S: type) type {
         fn init(socket: posix.socket_t, server: S) Self {
             return .{
                 .mode = .http,
+                .reader = .{},
                 .socket = socket,
                 .server = server,
                 .last_active = now(),
@@ -502,31 +500,25 @@ fn Client(comptime S: type) type {
         }
 
         fn readBuf(self: *Self) []u8 {
-            // We might have read a partial http or websocket message.
-            // Subsequent reads must read from where we left off.
-            std.debug.assert(self.read_pos < self.read_buf.len);
-            return self.read_buf[self.read_len..];
+            return self.reader.readBuf();
         }
 
         fn processData(self: *Self, len: usize) !bool {
-            const end = self.read_len + len;
-            std.debug.assert(end >= self.read_pos);
-
             self.last_active = now();
-            const data = self.read_buf[self.read_pos..end];
+            self.reader.len += len;
 
             switch (self.mode) {
                 .http => {
-                    try self.processHTTPRequest(data);
+                    try self.processHTTPRequest();
                     return true;
                 },
-                .websocket => return self.processWebsocketMessage(data),
+                .websocket => return self.processWebsocketMessage(),
             }
         }
 
-        fn processHTTPRequest(self: *Self, request: []u8) HTTPError!void {
-            // We should never get pipelined HTTP requests
-            std.debug.assert(self.read_pos == 0);
+        fn processHTTPRequest(self: *Self) HTTPError!void {
+            std.debug.assert(self.reader.pos == 0);
+            const request = self.reader.buf[0..self.reader.len];
 
             errdefer self.server.queueClose(self.socket);
 
@@ -538,7 +530,6 @@ fn Client(comptime S: type) type {
             // we're only expecting [body-less] GET requests.
             if (std.mem.endsWith(u8, request, "\r\n\r\n") == false) {
                 // we need more data, put any more data here
-                self.read_len = request.len;
                 return;
             }
 
@@ -560,7 +551,7 @@ fn Client(comptime S: type) type {
             };
 
             // the next incoming data can go to the front of our buffer
-            self.read_len = 0;
+            self.reader.len = 0;
         }
 
         fn handleHTTPRequest(self: *Self, request: []u8) !void {
@@ -684,10 +675,10 @@ fn Client(comptime S: type) type {
             return self.send(response, true);
         }
 
-        fn processWebsocketMessage(self: *Self, data: []u8) !bool {
+        fn processWebsocketMessage(self: *Self) !bool {
             errdefer self.server.queueClose(self.socket);
 
-            var reader = Reader{ .data = data };
+            var reader = &self.reader;
             while (true) {
                 const msg = reader.next() catch |err| {
                     switch (err) {
@@ -712,18 +703,9 @@ fn Client(comptime S: type) type {
                 }
             }
 
-            const incomplete = reader.data;
-            self.read_len = incomplete.len;
-            if (incomplete.len > 0) {
-                // we have part of the data for the next message
-
-                // can't use @memset because incomplete is a slice of read_buf,
-                // so they could overlap
-
-                // TODO: this can be skipped if we know that the next message will
-                // fit into whatever reamining space we have.
-                std.mem.copyForwards(u8, self.read_buf[0..incomplete.len], incomplete);
-            }
+            // We might have read part of the next message. Our reader potentially
+            // has to move data around in its buffer to make space.
+            reader.compact();
             return true;
         }
 
@@ -815,23 +797,52 @@ fn Client(comptime S: type) type {
 // can return zero or more Messages. When next returns null, any incomplete
 // message will remain in reader.data
 const Reader = struct {
-    data: []u8,
+    // position in buf of the start of the next message
+    pos: usize = 0,
+
+    // position in buf up until where we have valid data
+    // (any new reads must be placed after this)
+    len: usize = 0,
+
+    // we add 140 to allow 1 control message (ping/pong/close) to be
+    // fragmented into a normal message.
+    buf: [MAX_MESSAGE_SIZE + 140]u8 = undefined,
+
+    fn readBuf(self: *Reader) []u8 {
+        // We might have read a partial http or websocket message.
+        // Subsequent reads must read from where we left off.
+        return self.buf[self.len..];
+    }
 
     fn next(self: *Reader) !?Message {
-        var data = self.data;
-        if (data.len < 2) {
-            return null;
-        }
+        var buf = self.buf[self.pos..self.len];
 
-        const byte1 = data[0];
+        const length_of_len, const message_len = extractLengths(buf) orelse {
+            // we don't have enough bytes
+            return null;
+        };
+
+        const byte1 = buf[0];
 
         if (byte1 & 112 != 0) {
             return error.ReservedFlags;
         }
 
+        const fin = byte1 & 128 == 128;
+        if (!fin) {
+            return error.ContinuationNotSupported;
+        }
+
+        if (buf[1] & 128 != 128) {
+            // client -> server messages _must_ be masked
+            return error.NotMasked;
+        }
+
+        // var is_continuation = false;
         var message_type: Message.Type = undefined;
         switch (byte1 & 15) {
-            0 => return error.ContinuationNotSupported, // TODO??
+            // 0 => is_continuation = true,
+            0 => return error.ContinuationNotSupported,
             1 => message_type = .text,
             2 => message_type = .binary,
             8 => message_type = .close,
@@ -840,54 +851,105 @@ const Reader = struct {
             else => return error.InvalidMessageType,
         }
 
-        if (byte1 & 128 != 128) {
-            // TODO??
-            return error.ContinuationNotSupported;
-        }
-
-        const byte2 = data[1];
-        if (byte2 & 128 != 128) {
-            // client -> server messages _must_ be masked
-            return error.NotMasked;
-        }
-
-        const length_of_len: usize = switch (byte2 & 127) {
-            126 => 2,
-            127 => 8,
-            else => 0,
-        };
-
-        if (data.len < length_of_len + 2) {
-            // we definitely don't have enough data yet
-            return null;
-        }
-
-        const message_len = switch (length_of_len) {
-            2 => @as(u16, @intCast(data[3])) | @as(u16, @intCast(data[2])) << 8,
-            8 => @as(u64, @intCast(data[9])) | @as(u64, @intCast(data[8])) << 8 | @as(u64, @intCast(data[7])) << 16 | @as(u64, @intCast(data[6])) << 24 | @as(u64, @intCast(data[5])) << 32 | @as(u64, @intCast(data[4])) << 40 | @as(u64, @intCast(data[3])) << 48 | @as(u64, @intCast(data[2])) << 56,
-            else => data[1] & 127,
-        } + length_of_len + 2 + 4; // +2 for header prefix, +4 for mask
-
         if (message_len > MAX_MESSAGE_SIZE) {
             return error.TooLarge;
         }
 
-        if (data.len < message_len) {
+        if (buf.len < message_len) {
             return null;
         }
 
         // prefix + length_of_len + mask
         const header_len = 2 + length_of_len + 4;
 
-        const payload = data[header_len..message_len];
-        mask(data[header_len - 4 .. header_len], payload);
+        const payload = buf[header_len..message_len];
+        mask(buf[header_len - 4 .. header_len], payload);
+
+        self.pos += message_len;
 
-        self.data = data[message_len..];
         return .{
             .type = message_type,
             .data = payload,
         };
     }
+
+    fn extractLengths(buf: []const u8) ?struct{usize, usize} {
+        if (buf.len < 2) {
+            return null;
+        }
+
+        const length_of_len: usize = switch (buf[1] & 127) {
+            126 => 2,
+            127 => 8,
+            else => 0,
+        };
+
+        if (buf.len < length_of_len + 2) {
+            // we definitely don't have enough buf yet
+            return null;
+        }
+
+        const message_len = switch (length_of_len) {
+            2 => @as(u16, @intCast(buf[3])) | @as(u16, @intCast(buf[2])) << 8,
+            8 => @as(u64, @intCast(buf[9])) | @as(u64, @intCast(buf[8])) << 8 | @as(u64, @intCast(buf[7])) << 16 | @as(u64, @intCast(buf[6])) << 24 | @as(u64, @intCast(buf[5])) << 32 | @as(u64, @intCast(buf[4])) << 40 | @as(u64, @intCast(buf[3])) << 48 | @as(u64, @intCast(buf[2])) << 56,
+            else => buf[1] & 127,
+        } + length_of_len + 2 + 4; // +2 for header prefix, +4 for mask;
+
+        return .{length_of_len, message_len};
+    }
+
+    // This is called after we've processed complete websocket messages (this
+    // only applies to websocket messages).
+    // There are three cases:
+    // 1 - We don't have any incomplete data (for a subsequent message) in buf.
+    //     This is the easier to handle, we can set pos & len to 0.
+    // 2 - We have part of the next message, but we know it'll fit in the
+    //     remaining buf. We don't need to do anything
+    // 3 - We have part of the next message, but either it won't fight into the
+    //     remaining buffer, or we don't know (because we don't have enough
+    //     of the header to tell the length). We need to "compact" the buffer
+    fn compact(self: *Reader) void {
+        const pos = self.pos;
+        const len = self.len;
+
+        std.debug.assert(pos <= len);
+
+        // how many (if any) partial bytes do we have
+        const partial_bytes = len - pos;
+
+        if (partial_bytes == 0) {
+            // We have no partial bytes. Setting these to 0 ensures that we
+            // get the best utilization of our buffer
+            self.pos = 0;
+            self.len = 0;
+            return;
+        }
+
+        const partial = self.buf[pos..len];
+
+        // If we have enough bytes of the next message to tell its length
+        // we'll be able to figure out whether we need to do anything or not.
+        if (extractLengths(partial)) |length_meta| {
+            const next_message_len = length_meta.@"1";
+            // if this isn't true, then we have a full message and it
+            // should have been processed.
+            std.debug.assert(next_message_len > partial_bytes);
+
+            const missing_bytes = next_message_len - partial_bytes;
+
+            const free_space = self.buf.len - len;
+            if (missing_bytes < free_space) {
+                // we have enough space in our buffer, as is,
+                return;
+            }
+        }
+
+        // We're here because we either don't have enough bytes of the next
+        // message, or we know that it won't fit in our buffer as-is.
+        std.mem.copyForwards(u8, &self.buf, partial);
+        self.pos = 0;
+        self.len = partial_bytes;
+    }
 };
 
 const Message = struct {
@@ -1148,7 +1210,7 @@ test "Client: http valid handshake" {
         "sec-websocket-key: this is my key\r\n" ++
         "Custom:  Header-Value\r\n\r\n";
 
-    @memcpy(client.read_buf[0..request.len], request);
+    @memcpy(client.reader.buf[0..request.len], request);
     try testing.expectEqual(true, try client.processData(request.len));
 
     try testing.expectEqual(.websocket, client.mode);
@@ -1169,7 +1231,7 @@ test "Client: http get json version" {
 
     const request = "GET /json/version HTTP/1.1\r\n\r\n";
 
-    @memcpy(client.read_buf[0..request.len], request);
+    @memcpy(client.reader.buf[0..request.len], request);
     try testing.expectEqual(true, try client.processData(request.len));
 
     try testing.expectEqual(.http, client.mode);
@@ -1202,21 +1264,21 @@ test "Client: read invalid websocket message" {
         error.InvalidMessageType,
         1002,
         "",
-        &.{ 131, 1 }, // 128 (fin) | 3  where 3 isn't a valid type
+        &.{ 131, 128, 'm', 'a', 's', 'k' }, // 128 (fin) | 3  where 3 isn't a valid type
     );
 
     try assertWebSocketError(
         error.ContinuationNotSupported,
         1003,
         "",
-        &.{ 128, 1 }, // 128 (fin) | 0  where 0 is a continuation frame
+        &.{ 128, 128, 'm', 'a', 's', 'k' }, // 128 (fin) | 0  where 0 is a continuation frame
     );
 
     try assertWebSocketError(
         error.ContinuationNotSupported,
         1003,
         "",
-        &.{ 1, 1 }, // 0 (non-fin) | 1  non-fin (contination) not supported
+        &.{ 1, 128, 'm', 'a', 's', 'k' }, // 0 (non-fin) | 1  non-fin (contination) not supported
     );
 
     for ([_]u8{ 16, 32, 64 }) |rsv| {
@@ -1225,7 +1287,7 @@ test "Client: read invalid websocket message" {
             error.ReservedFlags,
             1002,
             "",
-            &.{ rsv, 0 },
+            &.{ rsv, 128, 'm', 'a', 's', 'k' },
         );
 
         // as a bitmask
@@ -1233,7 +1295,7 @@ test "Client: read invalid websocket message" {
             error.ReservedFlags,
             1002,
             "",
-            &.{ rsv + 4, 0 },
+            &.{ rsv + 4, 128, 'm', 'a', 's', 'k' },
         );
     }
 
@@ -1241,14 +1303,14 @@ test "Client: read invalid websocket message" {
         error.NotMasked,
         1002,
         "",
-        &.{ 129, 127 }, // client->server messages must be masked
+        &.{ 129, 1, 'a' }, // client->server messages must be masked
     );
 
     try assertWebSocketError(
         error.TooLarge,
         1009,
         "",
-        &.{ 129, 255, 0, 0, 0, 0, 0, 4, 0, 1 }, // 1024 * 256 + 1
+        &.{ 129, 255, 0, 0, 0, 0, 0, 4, 0, 1, 'm', 'a', 's', 'k' }, // 1024 * 256 + 1
     );
 }
 
@@ -1436,7 +1498,7 @@ fn assertHTTPError(
     defer ms.deinit();
 
     var client = Client(*MockServer).init(0, &ms);
-    @memcpy(client.read_buf[0..input.len], input);
+    @memcpy(client.reader.buf[0..input.len], input);
     try testing.expectError(expected_error, client.processData(input.len));
 
     const expected_response = std.fmt.comptimePrint(
@@ -1460,7 +1522,7 @@ fn assertWebSocketError(
     var client = Client(*MockServer).init(0, &ms);
     client.mode = .websocket; // force websocket message processing
 
-    @memcpy(client.read_buf[0..input.len], input);
+    @memcpy(client.reader.buf[0..input.len], input);
     try testing.expectError(expected_error, client.processData(input.len));
 
     try testing.expectEqual(1, ms.sent.items.len);
@@ -1490,7 +1552,7 @@ fn assertWebSocketMessage(
     var client = Client(*MockServer).init(0, &ms);
     client.mode = .websocket; // force websocket message processing
 
-    @memcpy(client.read_buf[0..input.len], input);
+    @memcpy(client.reader.buf[0..input.len], input);
     const more = try client.processData(input.len);
 
     try testing.expectEqual(1, ms.sent.items.len);

From 701e8277d6bce1703fd35f9c3df2a677f1cd2dd3 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Fri, 7 Feb 2025 18:18:53 +0800
Subject: [PATCH 08/10] support continuation frames

---
 src/server.zig | 297 ++++++++++++++++++++++++++++++++++++-------------
 1 file changed, 218 insertions(+), 79 deletions(-)

diff --git a/src/server.zig b/src/server.zig
index 980127c3..43a79acd 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -54,7 +54,8 @@ const WebSocketError = error{
     NotMasked,
     TooLarge,
     InvalidMessageType,
-    ContinuationNotSupported,
+    InvalidContinuation,
+    NestedFragementation,
 };
 const Error = IOError || cdp.Error || HTTPError || WebSocketError;
 
@@ -212,7 +213,7 @@ const Server = struct {
         };
 
         const more = client.processData(size) catch |err| {
-            std.debug.print("Client Processing Error: {}\n", .{err});
+            log.err("Client Processing Error: {}\n", .{err});
             return;
         };
 
@@ -460,8 +461,6 @@ fn Client(comptime S: type) type {
     const CLOSE_NORMAL = [_]u8{ 136, 2, 3, 232 }; // code: 1000
     const CLOSE_TOO_BIG = [_]u8{ 136, 2, 3, 241 }; // 1009
     const CLOSE_PROTOCOL_ERROR = [_]u8{ 136, 2, 3, 234 }; //code: 1002
-    // This should be removed once we support continuation frames
-    const CLOSE_UNSUPPORTED_ERROR = [_]u8{ 136, 2, 3, 235 }; //code: 1003
     const CLOSE_TIMEOUT = [_]u8{ 136, 2, 15, 160 }; // code: 4000
 
     return struct {
@@ -483,10 +482,10 @@ fn Client(comptime S: type) type {
         fn init(socket: posix.socket_t, server: S) Self {
             return .{
                 .mode = .http,
-                .reader = .{},
                 .socket = socket,
                 .server = server,
                 .last_active = now(),
+                .reader = .{ .allocator = server.allocator },
             };
         }
 
@@ -497,6 +496,7 @@ fn Client(comptime S: type) type {
                 }
             }
             self.server.queueClose(self.socket);
+            self.reader.deinit();
         }
 
         fn readBuf(self: *Self) []u8 {
@@ -686,7 +686,9 @@ fn Client(comptime S: type) type {
                         error.NotMasked => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
                         error.ReservedFlags => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
                         error.InvalidMessageType => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
-                        error.ContinuationNotSupported => self.send(&CLOSE_UNSUPPORTED_ERROR, false) catch {},
+                        error.InvalidContinuation => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
+                        error.NestedFragementation => self.send(&CLOSE_PROTOCOL_ERROR, false) catch {},
+                        error.OutOfMemory => {}, // don't borther trying to send an error in this case
                     }
                     return err;
                 } orelse break;
@@ -701,6 +703,9 @@ fn Client(comptime S: type) type {
                     },
                     .text, .binary => try self.server.handleCDP(msg.data),
                 }
+                if (msg.cleanup_fragment) {
+                    reader.cleanup();
+                }
             }
 
             // We might have read part of the next message. Our reader potentially
@@ -797,6 +802,8 @@ fn Client(comptime S: type) type {
 // can return zero or more Messages. When next returns null, any incomplete
 // message will remain in reader.data
 const Reader = struct {
+    allocator: Allocator,
+
     // position in buf of the start of the next message
     pos: usize = 0,
 
@@ -808,6 +815,19 @@ const Reader = struct {
     // fragmented into a normal message.
     buf: [MAX_MESSAGE_SIZE + 140]u8 = undefined,
 
+    fragments: ?Fragments = null,
+
+    fn deinit(self: *Reader) void {
+        self.cleanup();
+    }
+
+    fn cleanup(self: *Reader) void {
+        if (self.fragments) |*f| {
+            f.message.deinit(self.allocator);
+            self.fragments = null;
+        }
+    }
+
     fn readBuf(self: *Reader) []u8 {
         // We might have read a partial http or websocket message.
         // Subsequent reads must read from where we left off.
@@ -815,65 +835,105 @@ const Reader = struct {
     }
 
     fn next(self: *Reader) !?Message {
-        var buf = self.buf[self.pos..self.len];
+        LOOP: while (true) {
+            var buf = self.buf[self.pos..self.len];
 
-        const length_of_len, const message_len = extractLengths(buf) orelse {
-            // we don't have enough bytes
-            return null;
-        };
+            const length_of_len, const message_len = extractLengths(buf) orelse {
+                // we don't have enough bytes
+                return null;
+            };
 
-        const byte1 = buf[0];
+            const byte1 = buf[0];
 
-        if (byte1 & 112 != 0) {
-            return error.ReservedFlags;
+            if (byte1 & 112 != 0) {
+                return error.ReservedFlags;
+            }
+
+            if (buf[1] & 128 != 128) {
+                // client -> server messages _must_ be masked
+                return error.NotMasked;
+            }
+
+            var is_continuation = false;
+            var message_type: Message.Type = undefined;
+            switch (byte1 & 15) {
+                0 => is_continuation = true,
+                1 => message_type = .text,
+                2 => message_type = .binary,
+                8 => message_type = .close,
+                9 => message_type = .ping,
+                10 => message_type = .pong,
+                else => return error.InvalidMessageType,
+            }
+
+            if (message_len > MAX_MESSAGE_SIZE) {
+                return error.TooLarge;
+            }
+
+            if (buf.len < message_len) {
+                return null;
+            }
+
+            // prefix + length_of_len + mask
+            const header_len = 2 + length_of_len + 4;
+
+            const payload = buf[header_len..message_len];
+            mask(buf[header_len - 4 .. header_len], payload);
+
+            // whatever happens after this, we know where the next message starts
+            self.pos += message_len;
+
+            const fin = byte1 & 128 == 128;
+
+            if (is_continuation) {
+                const fragments = &(self.fragments orelse return error.InvalidContinuation);
+                if (fragments.message.items.len + message_len > MAX_MESSAGE_SIZE) {
+                    return error.TooLarge;
+                }
+
+                try fragments.message.appendSlice(self.allocator, payload);
+
+                if (fin == false) {
+                    // maybe we have more parts of the message waiting
+                    continue :LOOP;
+                }
+
+                // this continuation is done!
+                return .{
+                    .type = fragments.type,
+                    .data = fragments.message.items,
+                    .cleanup_fragment = true,
+                };
+            }
+
+            const can_be_fragmented = message_type == .text or message_type == .binary;
+            if (self.fragments != null and can_be_fragmented) {
+                // if this isn't a continuation, then we can't have fragements
+                return error.NestedFragementation;
+            }
+
+            if (fin == false) {
+                if (can_be_fragmented == false) {
+                    return error.InvalidContinuation;
+                }
+
+                // not continuation, and not fin. It has to be the first message
+                // in a fragemented message.
+                var fragments = Fragments{ .message = .{}, .type = message_type };
+                try fragments.message.appendSlice(self.allocator, payload);
+                self.fragments = fragments;
+                continue :LOOP;
+            }
+
+            return .{
+                .data = payload,
+                .type = message_type,
+                .cleanup_fragment = false,
+            };
         }
-
-        const fin = byte1 & 128 == 128;
-        if (!fin) {
-            return error.ContinuationNotSupported;
-        }
-
-        if (buf[1] & 128 != 128) {
-            // client -> server messages _must_ be masked
-            return error.NotMasked;
-        }
-
-        // var is_continuation = false;
-        var message_type: Message.Type = undefined;
-        switch (byte1 & 15) {
-            // 0 => is_continuation = true,
-            0 => return error.ContinuationNotSupported,
-            1 => message_type = .text,
-            2 => message_type = .binary,
-            8 => message_type = .close,
-            9 => message_type = .ping,
-            10 => message_type = .pong,
-            else => return error.InvalidMessageType,
-        }
-
-        if (message_len > MAX_MESSAGE_SIZE) {
-            return error.TooLarge;
-        }
-
-        if (buf.len < message_len) {
-            return null;
-        }
-
-        // prefix + length_of_len + mask
-        const header_len = 2 + length_of_len + 4;
-
-        const payload = buf[header_len..message_len];
-        mask(buf[header_len - 4 .. header_len], payload);
-
-        self.pos += message_len;
-
-        return .{
-            .type = message_type,
-            .data = payload,
-        };
     }
 
-    fn extractLengths(buf: []const u8) ?struct{usize, usize} {
+    fn extractLengths(buf: []const u8) ?struct { usize, usize } {
         if (buf.len < 2) {
             return null;
         }
@@ -895,7 +955,7 @@ const Reader = struct {
             else => buf[1] & 127,
         } + length_of_len + 2 + 4; // +2 for header prefix, +4 for mask;
 
-        return .{length_of_len, message_len};
+        return .{ length_of_len, message_len };
     }
 
     // This is called after we've processed complete websocket messages (this
@@ -952,9 +1012,15 @@ const Reader = struct {
     }
 };
 
+const Fragments = struct {
+    type: Message.Type,
+    message: std.ArrayListUnmanaged(u8),
+};
+
 const Message = struct {
     type: Type,
     data: []const u8,
+    cleanup_fragment: bool,
 
     const Type = enum {
         text,
@@ -1135,7 +1201,6 @@ test "Client: http invalid request" {
         "Request too large",
         "GET /over/9000 HTTP/1.1\r\n" ++ "Header: " ++ ("a" ** 2050) ++ "\r\n\r\n",
     );
-
 }
 
 test "Client: http invalid handshake" {
@@ -1260,25 +1325,12 @@ test "Client: write websocket message" {
 }
 
 test "Client: read invalid websocket message" {
+    // 131 = 128 (fin) | 3  where 3 isn't a valid type
     try assertWebSocketError(
         error.InvalidMessageType,
         1002,
         "",
-        &.{ 131, 128, 'm', 'a', 's', 'k' }, // 128 (fin) | 3  where 3 isn't a valid type
-    );
-
-    try assertWebSocketError(
-        error.ContinuationNotSupported,
-        1003,
-        "",
-        &.{ 128, 128, 'm', 'a', 's', 'k' }, // 128 (fin) | 0  where 0 is a continuation frame
-    );
-
-    try assertWebSocketError(
-        error.ContinuationNotSupported,
-        1003,
-        "",
-        &.{ 1, 128, 'm', 'a', 's', 'k' }, // 0 (non-fin) | 1  non-fin (contination) not supported
+        &.{ 131, 128, 'm', 'a', 's', 'k' },
     );
 
     for ([_]u8{ 16, 32, 64 }) |rsv| {
@@ -1299,18 +1351,84 @@ test "Client: read invalid websocket message" {
         );
     }
 
+    // client->server messages must be masked
     try assertWebSocketError(
         error.NotMasked,
         1002,
         "",
-        &.{ 129, 1, 'a' }, // client->server messages must be masked
+        &.{ 129, 1, 'a' },
     );
 
+    // length of message is 0000 0401, i.e: 1024 * 256 + 1
     try assertWebSocketError(
         error.TooLarge,
         1009,
         "",
-        &.{ 129, 255, 0, 0, 0, 0, 0, 4, 0, 1, 'm', 'a', 's', 'k' }, // 1024 * 256 + 1
+        &.{ 129, 255, 0, 0, 0, 0, 0, 4, 0, 1, 'm', 'a', 's', 'k' },
+    );
+
+    // continuation type message must come after a normal message
+    // even when not a fin frame
+    try assertWebSocketError(
+        error.InvalidContinuation,
+        1002,
+        "",
+        &.{ 0, 129, 'm', 'a', 's', 'k', 'd' },
+    );
+
+    // continuation type message must come after a normal message
+    // even as a fin frame
+    try assertWebSocketError(
+        error.InvalidContinuation,
+        1002,
+        "",
+        &.{ 128, 129, 'm', 'a', 's', 'k', 'd' },
+    );
+
+    // text (non-fin) - text (non-fin)
+    try assertWebSocketError(
+        error.NestedFragementation,
+        1002,
+        "",
+        &.{ 1, 129, 'm', 'a', 's', 'k', 'd', 1, 128, 'k', 's', 'a', 'm' },
+    );
+
+    // text (non-fin) - text (fin) should always been continuation after non-fin
+    try assertWebSocketError(
+        error.NestedFragementation,
+        1002,
+        "",
+        &.{ 1, 129, 'm', 'a', 's', 'k', 'd', 129, 128, 'k', 's', 'a', 'm' },
+    );
+
+    // close must be fin
+    try assertWebSocketError(
+        error.InvalidContinuation,
+        1002,
+        "",
+        &.{
+            8, 129, 'm', 'a', 's', 'k', 'd',
+        },
+    );
+
+    // ping must be fin
+    try assertWebSocketError(
+        error.InvalidContinuation,
+        1002,
+        "",
+        &.{
+            9, 129, 'm', 'a', 's', 'k', 'd',
+        },
+    );
+
+    // pong must be fin
+    try assertWebSocketError(
+        error.InvalidContinuation,
+        1002,
+        "",
+        &.{
+            10, 129, 'm', 'a', 's', 'k', 'd',
+        },
     );
 }
 
@@ -1389,6 +1507,21 @@ test "Client: fuzz" {
         [_]u8{ 129, 254, 2, 175, 1, 2, 3, 4 } ++ "A" ** 687,
     );
 
+    // non-fin text message
+    try websocket_messages.appendSlice(allocator, &.{ 1, 130, 0, 0, 0, 0, 1, 2 });
+
+    // continuation
+    try websocket_messages.appendSlice(allocator, &.{ 0, 131, 0, 0, 0, 0, 3, 4, 5 });
+
+    // pong happening in fragement
+    try websocket_messages.appendSlice(allocator, &.{ 138, 128, 0, 0, 0, 0 });
+
+    // more continuation
+    try websocket_messages.appendSlice(allocator, &.{ 0, 130, 0, 0, 0, 0, 6, 7 });
+
+    // fin
+    try websocket_messages.appendSlice(allocator, &.{ 128, 133, 0, 0, 0, 0, 8, 9, 10, 11, 12 });
+
     // close
     try websocket_messages.appendSlice(
         allocator,
@@ -1455,7 +1588,7 @@ test "Client: fuzz" {
             ms.sent.items[4],
         );
 
-        try testing.expectEqual(2, ms.cdp.items.len);
+        try testing.expectEqual(3, ms.cdp.items.len);
         try testing.expectEqualSlices(
             u8,
             &.{ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 },
@@ -1468,6 +1601,12 @@ test "Client: fuzz" {
             ms.cdp.items[1],
         );
 
+        try testing.expectEqualSlices(
+            u8,
+            &.{ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 },
+            ms.cdp.items[2],
+        );
+
         try testing.expectEqual(true, ms.closed);
     }
 }

From 89ff1411e930c1229b2031c5580422bb58a14cc4 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Thu, 13 Feb 2025 09:34:25 +0800
Subject: [PATCH 09/10] Fix memory leak on invalid websocket continuation
 frames

---
 src/server.zig | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/src/server.zig b/src/server.zig
index 43a79acd..95f51ec6 100644
--- a/src/server.zig
+++ b/src/server.zig
@@ -676,9 +676,13 @@ fn Client(comptime S: type) type {
         }
 
         fn processWebsocketMessage(self: *Self) !bool {
-            errdefer self.server.queueClose(self.socket);
-
             var reader = &self.reader;
+
+            errdefer {
+                reader.cleanup();
+                self.server.queueClose(self.socket);
+            }
+
             while (true) {
                 const msg = reader.next() catch |err| {
                     switch (err) {

From fa9b6f58e5a5c21f3a2ec31857013f95f3a4cf97 Mon Sep 17 00:00:00 2001
From: Karl Seguin <k@openmymind.io>
Date: Thu, 13 Feb 2025 09:42:26 +0800
Subject: [PATCH 10/10] trying to fix submodule version

---
 vendor/zig-js-runtime | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/vendor/zig-js-runtime b/vendor/zig-js-runtime
index f40f4914..61c71e5e 160000
--- a/vendor/zig-js-runtime
+++ b/vendor/zig-js-runtime
@@ -1 +1 @@
-Subproject commit f40f4914667f4fc7cd14ee0df0e76a2fd8d835b4
+Subproject commit 61c71e5e390316786a0c780d9135a45890bda846